研发的轩辕大模型,在金融场景中的任务评测中,效果相较于通用大模型大幅度的提高,表现出明显的金融领域优势。
在诸如金融名词理解、金融市场评论、金融数据分析和金融新闻理解等任务的评测中,轩辕超越了其他四种开源大模型,赢得了150次回答中63.33%的胜率,充分凸显了其在金融领域的显著优势。
根据实验结果,轩辕有10.2%的任务表现超越ChatGPT,61.22%的任务表现与之持平。其中涉及数学计算、场景写作、逻辑推理、文本摘要等13个主要维度,验证了轩辕的通用能力。
度小满表示,轩辕大模型将有力地推动大模型在金融行业的应用,为客户提供更准确、全面的金融咨询与服务。
目前,千亿级的轩辕模型已可以在Huggingface中申请下载(下载地址见文末)。
其专业、快速、精准、富有情感的内容表达,无不向大家展示NLP大模型惊人的自然语言理解与生成能力。
ChatGPT的的诞生,掀起了新一轮技术革命,自此各类大模型层出不穷。而度小满也开启了金融大模型的研发之路。
“将ChatGPT的能力迁移到金融领域,会产生怎么样颠覆性的影响?”,为了寻找问题的答案,度小满将轩辕大模型定位在了三个维度:
度小满依托多年行业实践积累,构建了具有金融垂直领域特色的、千亿tokens的中文预训练数据集。
度小满数据智能部总经理、技术委员会执行主席杨青表示,经过清洗和标注的高质量数据集,不仅在通用性方面与ChatGPT达到持平成为可能,且明显提升了模型在金融垂直领域的性能。
值得一提的是,轩辕数据集包含了诸如金融研报、股票、基金、银行、保险等方向的专业知识。
通过在训练过程中加入大量金融对话数据并针对金融领域进行特定的预训练调优,轩辕在金融垂直领域的表现得到了显著提升。
度小满CTO许冬亮认为,生成式大模型在内容生成与创作、信息摘要与总结、知识理解与问答、自然交互与对话等方面具备很出色的能力,在金融场景中会有广泛的应用。
在前台,生成式大模型将大幅度的提高客户经理的专业水平和服务能力,大幅度降低客户经理的经营成本,让每一个人都拥有24小时在线的专业客户经理成为可能。
在中台,生成式大模型有机会改变企业内知识获取、内容创作、会议与沟通、代码开发与测试的方式,进而大幅度的提高企业内部办公效率,甚至引发研发测试模式变革,全方位的提升金融企业内部运营效率。
在后台,大模型将成为智能科技底座的标配,大幅度降低智能技术应用的门槛,只需少量标注数据甚至无需调整就可以让智能技术覆盖广泛的场景。
通用语音或文本的交互方式,可以为金融用户更好的提供24小时在线咨询和答疑服务。为降低人力成本和风险,引入智能客服已成为金融企业的基础配置。
然而实际上,面对用户多样化复杂场景的询问,智能客服常常表现出“智障”。以简单的名词解释为例,能够正常的看到轩辕的表现更为专业。
在回复中,轩辕从个人信用记录、收入水平、负债情况和担保能力四个方面做了全面的解释,清晰的结构、详细的计算方式以及实用的建议,实际做到以用户视角详解专业概念。
现有的AI金融模型也经常会犯一些愚蠢的错误,比如:股息率 = 股息 ÷ 股票在市场上买卖的金额= 5美元 ÷ 100美元= 0.5。
轩辕对数据和知识的挖掘与理解,不是简单的关键词搜索,而是多语义关联与匹配,更智能地识别出用户的真实意图,进而给出更符合客户的真实需求的答案。
例如AI大模型能够最终靠分析金融数据、新闻动态、社交评论等每日信息,为投资者提供市场舆情和风险预测等服务。
度小满认为,轩辕大模型要想无限趋近于人类的思维能力,不能停留在标准答案上,需要可处理更具开放性、灵活性的复杂问题。
从下面的示例中,能够正常的看到,轩辕会提醒客户结合资产状况、收益目标和风险偏好,以及外部的市场动态,来来投资决策。
轩辕在解释”牛市”和”熊市”含义的同时,还强调了投资者要怎么来面对两种市场状况,以及可采取的策略。
这一点相比其他模型,不仅交流更充分、信息更有价值,而且更显人性化,更有温度。
轩辕还能针对当下金融时事分析背后的原因,并据此从不同维度对金融市场的未来走势进行预测,给出总体结果评估,为投资者提供明确的决策参考。
历史也证明了,安卓系统的开源不仅使得技术的发展更加快速,也促进了开发者之间的交流与合作,让移动应用和服务得以更快地普及到全球各地,并带来更加多样化的用户体验。
得益于开源,让人人都可参与这个行业,这也使得菜鸟和小众开发者能够最终靠参与开源项目提升个人的技能和见识,让业界更加平等公正。
秉承这一精神,许冬亮表示,轩辕大模型是经度小满业务场景中积累的金融数据训练而来的,对金融有关问题的理解比通用大模型更有优势。
我们把大模型能力开放给金融机构,有利于推动大模型在金融行业的应用,降低大模型的应用门槛,提升金融行业智能化水平。