毕业论文
您现在的位置: 自动化 >> 自动化发展 >> 正文 >> 正文

科大讯飞研究报告星火燎原起AI场景落

来源:自动化 时间:2023/9/27

(报告出品方/作者:安信证券,赵阳,夏瀛韬)

1.星火大模型发布,积极掌握AI源头技术

1.1.从讯飞超脑到星火大模型,认知智能技术持续积累

认知智能多年积累,AI源头技术持续研发。科大讯飞坚持源头核心技术创新,人工智能关键核心技术始终保持国际前沿水平。公司承建有国家首批新一代人工智能开放创新平台、全国首个认知智能国家重点实验室(首批标杆全国重点实验室),以及语音及语言信息处理国家工程研究中心等国家级平台。

科大讯飞多年来积累了认知智能大模型综合研发实力、持续关键技术突破和创新能力,相关积累包括:1)在认知智能大模型最核心的Transformer深度神经网络算法方面拥有丰富的经验,Transformer算法已广泛应用于科大讯飞的语音识别、图文识别、机器翻译等任务,并已经开源了6个大类、超过40个通用领域的系列中文预训练语言模型,相关模型库月均调用量超万,在Github平台获得星标数位列同类中文预训练语言模型第一;2)在多年认知智能系统研发推广中积累了丰富的行业数据,为认知智能大模型的研发和专业领域优化提供了扎实基础;3)牵头国家专项,在国产化训练推理平台建设和优化方面持续投入形成的扎实积累。

“讯飞超脑”计划牵引,促使机器从“能听会说”向“能理解会思考”演进。年,公司发布讯飞超脑计划,明确提出要让机器像人一样具备能理解会思考的能力。年初,公司正式迭代并发布“讯飞超脑计划”。“讯飞超脑计划”将构建基于认知智能的人机协作、自我进化的复杂智能系统。即让机器的感知能力超过人类,深度理解领域专业知识,具备持续自主进化的能力;让机器全方面感知人和环境,懂各行各业知识,有通识和情感,能灵活运动,会多维表达,打造可持续自主进化的复杂智能系统,助力家庭陪伴机器人走进千家万户,造福亿万百姓生活。

讯飞超脑计划分为三个阶段,每个阶段都围绕“懂知识、善学习和能进化”,将软硬一体机器人和数字虚拟人向前推进。其中,第一阶段,在-年,科大讯飞将打造可养成的宠物机器人和专业虚拟人家族;第二阶段,时间为-年,将打造自适应行走的外骨骼机器人和陪伴虚拟人家族;第三阶段,时间为-年,将打造软硬一体懂知识会学习的陪伴机器人和自主学习虚拟人,帮助人类更好地应对未来。

从“讯飞超脑”到星火大模型,认知智能技术迭代突破。以“讯飞超脑计划”为牵引,公司关键技术持续突破,同时,公司布局认知智能大模型关键技术,不断推动认知智能技术迈向新台阶。年,讯飞智医助理首次通过国家执业医师考试临床综合笔试,并以分的成绩超过了96.3%的人类考生,让机器首次具有担任全科医生的能力;在年全球机器阅读理解顶级水平测试SQuAD2.0中,科大讯飞系统效果首次超过人类平均水平;年4月的CommonsenseQA2.0常识推理挑战赛中,科大讯飞以76.06%的成绩获得第一;

年7月,面对特定领域的知识推理,科大讯飞在OpenBookQA科学知识推理挑战赛中刷新最好成绩,成为全球首个超越人类平均水平(91.7%)的单模型;年12月,在多模态阅读理解评测VCR(VisualCommensenseReasoning)中再次获得第一,标志机器的阅读理解能力实现了从单模态到多模态的跨越。

年12月,科大讯飞启动了“1+N认知智能大模型技术及应用”专项攻关,其中“1”指的是通用认知智能大模型算法研发及高效训练方案底座平台,“N”指的是将认知智能大模型技术应用在教育、医疗、人机交互、办公、翻译等多个行业领域。年5月6日,公司成功举办“讯飞星火认知大模型”成果发布会。讯飞星火大模型是公司面向通用人工智能的技术探索,也是对标海外头部产品如ChatGPT的技术演进。与其他的大模型厂商产品发布不同,讯飞的星火大模型系列成果不仅包含了通用人工智能大模型,还包含了多种搭载了大模型的产品和落地场景,一方面展现了具体的应用方向,另一方面也将为大模型的持续迭代提供丰富的数据入口和数据资源。

星火大模型有望持续升级,年内仍有三大关键里程碑值得期待。星火大模型仍将持续迭代升级。6月9日首先将突破开放式问答(即实时问答),不是简单搜索,而是通过类搜索插件抓取知识,以更人性化的方式呈现结果;再次升级多轮对话能力;数学能力还会再上一个新的台阶。8月15日,将会突破代码能力,让开发者、合作伙伴非常方便地调用使用;多模态的交互能力也将正式开放。到今年10月24日的“开发者节”,希望星火大模型能够在通用的认知大模型能力上,通过科学的评测体系实现对标ChatGPT,在中文上实现能力超越,在英文上实现能力的对齐。

1.2.星火大模型聚焦七大核心能力,向通用人工智能迈进

发布通用认知智能大模型测评体系,聚焦七大核心能力。科大讯飞和中国科学技术大学共同承建的认知智能全国重点实验室牵头设计了面向通用人工智能大模型的测评体系,从7个主要方向、个细分任务类型对模型效果进行细化评价,包括文本生成、语言理解、知识问答、逻辑推理、数学能力、编程能力和多模态能力等,从而促使大模型的能力呈现更加客观。具体到星火大模型而言,发布会从七个方向对模型能力进行了全方位的展示,具备包括:多风格、多任务长文本生成;多层次、跨语种语言理解;泛领域、开放式知识问答;情境式、思维链逻辑推理;多题型、可解析数学能力;多功能、多语言代码能力;多模态输入和表达能力。

一是多风格、多任务长文本生成。星火大模型可以实现多种文本生成功能,比如生成欢迎词,创作一个特定要求的故事,还可以根据要求写作工作邮件等公文。此外,星火大模型可以实现用多种语言生成文本,例如用英文生成一个品宣文案,并支持对文案进行翻译。不仅如此,星火大模型还可以对文字用不同的风格进行再次创作,例如用小红书的风格重写文案等。我们认为,多风格、多任务的长文本生成式大预言模型的基础应用之一,星火大模型已经具备了相应的能力,为其他的应用奠定了基础。

二是多层次、跨语种语言理解。星火大模型可以实现不同层次的语义理解。如最细粒度的单词和语法方面的检查,以及对于句子含义的理解,乃至最高层次的关于句子情感的分析。语义理解是认知智能大模型的主要应用领域和研究方向之一,能够准确进行分词和情感识别,也是未来复杂场景下任务处理的基础。三是泛领域、开放式知识问答。星火大模型针对生活常识、科学知识、工作技巧以及医学知识等大众

转载请注明:http://www.0431gb208.com/sjszyzl/5912.html