Alpha掘金系列之八:沪深300另类舆情增强因子FinGPT对金融论坛数据情感的精准识别.docx
《Alpha掘金系列之八:沪深300另类舆情增强因子FinGPT对金融论坛数据情感的精准识别.docx》由会员分享,可在线阅读,更多相关《Alpha掘金系列之八:沪深300另类舆情增强因子FinGPT对金融论坛数据情感的精准识别.docx(20页珍藏版)》请在第一文库网上搜索。
1、内容目录一、另类数据情感分析的新方法5二、金融论坛评论的数据特征52.1数据来源52.2什么是1KM(1argeKnow1edgeMode1)52.3论坛的主帖和评论的区别7三、大语言开源模型落地81 .1利用大语言模型进行情感分析81.1.1 大模型强大的语言理解和更好的泛化能力81.1.2 GPT情感分析效果最佳,但成本过于高昂92 .2本地化部署的开源模型93 .2.1开源模型94 .2.2ChatG1M与FinGPT10四、情绪打分体系构建114.1 因子测试方法124.2 为什么要选择金融论坛评论数据124.3 大模型舆情情感因子134.4 因子相关性与因子收益15五、大模型金融论坛
2、舆情增强策略165.1策略构建165.2 策略表现16六、总结18七、附录18Z1FinGPT的推理代码样例185.3 推演的算力需求与微调的算力需求1873模型输入的“参数敏感性”19风险提示21图表目录图表1:1KM知识模型的核心5图表2:大知识模型的模型构建流程6图表3:1KM的情感打分优势6图表4:11M与1KM的推导区别7图表5:人工智能的发展周期7图表6:金融论坛主帖与评论的区别8图表7:自回归语言模型的输出步骤9图表8:HE1M大语言模型情感分析排行榜9图表9:ChatGPT情感分析得分比较9图表10:ChatGPTAP1调用价格9图表11:开源11M时间线10图表12:Chat
3、G1M的英文能力10图表13:ChatG1M的中文能力10图表14:FinGPT架构11图表15:FinGPT在情感打分任务上表现优异11图表16:国金金工股票情感打分体系12图表17:主帖内容示例12图表18:金融论坛评论的不同类型样例12图表19:主帖与评论相同构造情感因子的IC测试统计指标13图表20:评论数量分布13图表21:评论数最多的20只股票13图表22:评论的FinGPT情感打分分布13图表23:评论的1KM情感打分分布13图表24:大模型舆情情感因子含义与计算14图表25:大模型舆情情感因子IC测试统计结果14图表26:乐观情感和因子分位数组合测试统计指标15图表27:乐观情
4、感和因子分位数组合年化收益率15图表28:乐观情感和因子分位数组合净值曲线15图表29:大模型舆情情感因子与大类因子相关性15图表30:情感因子与市值因子相关性16图表31:常见基本面与技术因子的IC测试16图表32:大模型金融论坛舆情增强策略条件设置16图表33:大模型金融论坛舆情增强策略指标17图表34:大模型金融论坛舆情增强策略分年度收益17图表35:大模型金融论坛舆情增强策略净值曲线17图表36:FinGPT的推理demo18图表37:大语言模型训练的硬件与训练时间19图表38:没有任何input结构的11aMA2输出19图表39:A1paca-input结构下的11aMA2输出19图
5、表40:财联社新闻标题20图表41:不同提示词20图表42:不同提示词下博迁新材新闻的情感分析20图表43:不同提示词下酱香咖啡新闻的情感分析21一、另类数据情感分析的新方法情感分析是自然语言处理(N1P)的一个重要分支,通过运用N1P技术和机器学习算法,可以对文本的语义、情感表达和上下文进行分析,判断文本所表达的情感,从而得出文本的情绪例如正面、负面或中立的结论。在金融领域,情感分析在金融论坛评论上的分析有重要应用,因为金融论坛的情绪很大程度上反映了投资者的集体心态,投资者的心态、预期和信心可以对股票价格产生重大影响。我们从多个学术假设利结论拆解了情绪对股票价格产生影响的背后逻辑:情绪与决策
6、制定:投资者在决定买卖股票时,除了基于对公司基本面和技术分析的认知,还会受到其他投资者情绪的影响。乐观情绪往往促使投资者采取积极的投资行为,而消极情绪可能导致他们采取保守或逃避策略。从众心理:当大部分投资者在论坛上显示乐观情绪时,其他投资者可能会受到影响,从而产生相同的投资决策,导致股价上涨。相反,当论坛上的情绪普遍不乐观时,股价可能会受到压力并下跌。信息扩散:金融论坛通常是投资者获取和分享信息的平台。这些信息,无论其真实性如何,都可能引起市场反应。如果论坛上传播的信息让投资者感到乐观,股价可能上涨;相反,如果信息是消极的,股价可能会下跌。注意力偏差:当某个特定的股票或事件在论坛上被大量讨论,
7、这会导致更多的投资者将注意力集中在这个话题上,或者由于注意力偏差,投资者可能会过于专注于论坛上热门的话题,而忽视其他同样重要但未被广泛讨论的信息。这可能会导致投资者做出基于不完整信息的决策,强化了情绪反应或者忽视了其他重要信息。本篇报告是A1pha掘金系列的第八篇,我们通过开源的大语言模型FinGPT对子长科技公司提供的大量金融论坛评论进行了情感分析,通过验证论坛情感与股票价格之间的关系探索了大语言模型模和大知识模型情感分析在量化策略上的宜接应用。二.金融论坛评论的数据特征2.1 数据来源子长科技创建于2018年,创始团队包括前路透社,亚马逊,谷歌等人工智能及金融数据专家。公司创立以来,以包括
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Alpha 掘金 系列 沪深 300 另类 舆情 增强 因子 FinGPT 金融 论坛 数据 情感 精准 识别