ChatGPT中文财经文本分析任务表现初探——情感分析

坏孩子
坏孩子 这家伙很懒,还没有设置简介...

0 人点赞了该文章 · 50 浏览

ChatGPT中文财经文本分析任务表现初探——情感分析

作为一款由OpenAI练习的大型说话模子,ChatGPT在中文文本的舆情判定才能很是出色。它经过预先处置大量的中文文本,进修了人类的说话表达方式,以及对分歧话题的正面、负面、中性的语气评价。这使得ChatGPT具有较高的正确率和牢靠性,在舆情判定方面具有明显的上风。经过利用ChatGPT,我们可以更好地领会中文文本中隐含的感情偏向,从而更好地领会言论。

——ChatGPT

ChatGPT年头起囊括中文互联网,作为时下炙手可热的说话模子,它不但可以了解你的题目,还能停止笔墨创作甚至编码,它的无所事事正在革新我们对于AI的了解。

那末,作为一个专注于中文财经文本大数据办事的公司,我们决议测试一下它在中文财经文天职析的才能,摸索ChatGPT能否帮助我们更高效地完成特定的文天职析使命,优化工作流程和重点。

文本感情分析

以下为对话实摘:

Datago:接下来我会供给一些消息内容,请判定它们的感情属于正面还是负面。ChatGPT:好的,请供给消息内容。我会极力判定感情是正面还是负面。

测试起头

Datago:“英国经济“脱欧盈利”恐难持久”ChatGPT: 这句话的感情属于负面。Datago:“该项新办法可下降风险,削减损失”ChatGPT:这句话的感情属于正面。Datago:连亏两年却要分红3亿!深交所关注函来了ChatGPT:这则消息的感情属于负面。

初步测试成果使人欣喜,市道上基于辞书法构建的NLP模子甚至支流的财经资讯门户(以下图)在面临含有相反感情偏向辞汇的句子时轻易给出毛病成果,而ChatGPT成功躲避了这些圈套。

此外,ChatGPT甚至可以识别部分企业实体并正确了解财经信息的语义和舆情:

Datago:大股东Naspers已阶段性停止减持腾讯。ChatGPT:这句话触及到的企业是腾讯和Naspers,舆情是正面。由于大股东Naspers已经阶段性停止减持腾讯,这意味着Naspers对腾讯的未来照旧具有信心,不再对腾讯停止大范围减持。这对腾讯股价和投资者信心都有积极的影响,是以,我们可以以为这句话的舆情是正面的。

不外,ChatGPT在停止文本感情分析时,它凡是会设定为分析论述者自己的腔调,而不是对所会商的资产代价判定上。

是以,为了连结分歧性并更切近金融范畴的感情分析使命,我们尔后的测试中均将ChatGPT的感情分析使命限制于“资产代价”的判定上。

不外哪怕我们有设备使命,也许由于ChatGPT对对话高低文的记忆的不稳定性,我们也需要在会话中经常提醒它是对“资产代价”做判定。

明白是对“资产代价”的判定后,ChatGPT确切对于很多复杂语境的文本都能做出正确的感情分析和可谓冷艳的解读。但同时,我们也看到今朝ChatGPT作为一个面向通用处景下的会话使命的大说话模子,在被利用作为中文财经文本的感情分析工具时仍存在不敷。

舆情份析成果随机,逻辑判定不稳定

ChatGPT最使人冷艳的才能在于它可以连系之前的对话停止了解,做到像与人一样对话,但这也意味着它的天生成果会遭到之前对话的影响,对同一个文天职析成果会出现前后纷歧致的情况。

在这项测试中,我们先问了一个金融场景的感情分析题目:

然后我们新开了一个对话,从某财经论坛中摘取了一系列文本要求ChatGPT停止判定后,再次询问了同一个题目:

受之前对话的影响,ChatGPT给出了完全分歧的回答。

此外,ChatGPT的前后判定逻辑和标准纷歧致,在“买入/卖出”这类相反的题目中,它的给出的成果都是正面,前者的来由是对股票未来代价的看好,尔后者的是对投资者资产代价的看好。

天生内容的随机性在内容天生上可以让创作不再陈旧见解,具有千人千面的上风,但假如作为金融文本数据的分析工具,不能保证感情分析的分析逻辑和成果分歧性将是今朝ChatGPT一个严重缺点。

对金融范畴的覆盖和了解不敷

作为一个通用模子,它似乎未能了解某些中文财经语境或辞汇:

例如:限售股解禁

摘星摘帽:

关灯吃面:

经过上述例子可知,ChatGPT对金融范畴的现象特别是对现象的中文表述大概辞汇的解读和判定的均不理想。

坦白地说,这也是通用模子的通病,由于对金融财经范畴的中文文本语料,出格是带标注的语料的覆盖不敷,ChatGPT在面临这些特定辞汇时显得有些紊乱,但这也答应以经过拓展覆盖更多特定范畴的(标注)语料来处理。

不外除了前述的判定的稳定性和分歧性题目,另一个能够影响文天职析使命(包括感情分析)的严重缺点还在于ChatGPT尝试堆集和进修常识用于判定,但却没法保证常识的正确性。

未能保证数据实在性

此次我们询问了它一个具体的题目,ChatGPT也像模像样地给出个看似周全的回答。

遗憾的是,2020年英伟达股价不但没有下跌,而且上涨。

在机械之心测试New Bing (必应+ChatGPT) 的文章中也指出了类似的情况:ChatGPT在回答题目标时辰,能够会间接天生出预练习阶段见过的数据而非基于究竟,是以会出现天生内容与援用内容抵触的情况,并制造子虚信息。

舆情监测汇总

除了对于单一指定文本的感情分析,更现实也更有代价的使命实在还在于ChatGPT能否在批量处置海量文本数据后,间接帮助我们总结出一家公司大概行业的舆情。

由于ChatGPT今朝所覆盖的数据停止至2021年,我们就以2020年5月1日为例测试了ChatGPT能否具有(历史)信息整合和舆情整合才能,它暗示做不到。

将舆情覆盖范围指定为特定媒体种别后,ChatGPT间接起头甩锅,保举利用其他专门的工具了。

最初......

除了可以判定文本的感情偏向,在金融范畴的文天职析使命中,识别文本触及了哪些公司也是文天职析中一个很是根本但重要的使命。ChatGPT在实体识别(NER)方面的才能也可圈可点,我们将留待今后会商。

整体而言,ChatGPT作为一个面向对话使命的通用说话模子,在中文财经文本的感情分析使命上的表示可以说很是冷艳。但从今朝的测试而言,把ChatGPT间接利用在金融范畴,处置中文财经文本的感情分析等辨别使命,从而实在、稳定、正确地供给金融数据办事、指导投资决议还有一定间隔。此外,斟酌到金融企业对数据实时性的要求,若何操纵ChatGPT实时且本钱可控地处置海量实时更新的金融文本数据(消息,研报,交际媒体等等)并供给数据分析办事也是一个有待处理的题目。

和其他范畴一样,横空出世的ChatGPT确切让我们看到了说话模子更高的上限,也让我们对中文财经文本数据所包含的潜伏代价有了更多的期待。Datago接下来也将延续摸索ChatGPT的上风和鸿沟,并延续优化我们在中文财经文本处置中的方式和流程,从而为我们的客户供给更好的中文财经文本数据办事,摸索更具设想力的贸易场景。

以上内容由数行者科技供给。

ChatGPT中文财经文天职析使命表示初探——感情分析

发布于 2023-03-24 07:02

免责声明:

本文由 坏孩子 原创或收集发布于 火鲤鱼 ,著作权归作者所有,如有侵权可联系本站删除。

火鲤鱼 © 2024 专注小微企业服务 冀ICP备09002609号-8