2020年11月20日,2020中国5G+工业互联网大会在武汉开幕。习近平总书记向大会发来贺信,“希望湖北省和武汉市以此次大会召开为契机,弘扬伟大抗疫精神,大力推动数字经济发展,为推动经济高质量发展、服务构建新发展格局作出贡献”。
8月底,我国首批8家AI大模型产品获批名单出炉,由东湖高新区和中国科学院自动化研究所共建武汉人工智能研究院打造的“紫东太初”大模型位列其中,这也是全球首个图文音三模态大模型,曾于去年9月荣获2022世界人工智能大会最高奖项——SAIL大奖。
“这也意味着人工智能大模型开始真正进入大众的视野,赋能千行百业。”近日,武汉人工智能研究院(以下简称“武智院”)院长王金桥在接受长江日报《在场》栏目专访时表示,贯彻落实习近平总书记重要指示精神,将坚持以原始创新和核心技术研发为主导,以产业落地为目标,促进人工智能“走深向实”重塑千行百业。
“梦想光谷”AI绘画创作比赛优秀获奖作品吸引了市民驻足。参赛者依托“江城洛神”AI创作平台,将简短的文本描述通过Al创作出心目中的光谷。而“江城洛神”正是基于“紫东太初”大模型打造的人工智能内容创作平台。记者周超 摄
01
图文音三模态大模型
升级为多模态
王金桥介绍,大模型取名“紫东太初”,一是寓意紫气东来、混沌初开,代表人工智能从专用迈向了通用,从感知智能迈向了认知智能;二是“紫东”与中国科学院自动化研究所的谐音相通,代表着自动化所自身的意义和使命。
3个月前,中国科学院自动化研究所联合武智院发布“紫东太初”2.0全模态大模型,该大模型是在千亿参数三模态大模型“紫东太初”1.0基础上的升级,在此前语音、图像和文本三模态的基础上,加入了视频、信号、3D点云等模态数据,突破了认知增强的多模态关联等关键技术,具备全模态理解能力、生成能力和关联能力。这意味着在实际应用场景中,它将能够为行业创造更大价值。
今年以来,国内人工智能大模型如雨后春笋般涌现。据不完全统计,截至今年5月,国内已扎堆发布10亿级参数规模以上基础大模型79个,“百模大战”打响。其中,绝大多数都是语言类大模型。
“我们是国内最早开始大模型研究的团队之一。”王金桥介绍,得益于中国科学院自动化研究所在多模态数据领域的多年积累,团队一开始就选择了多模态大模型这条更艰难的路,实现语音、图像和文本等多种模态交叉协同与有机融合,打造更加拟人的人工智能。“在这条研发路径上,我们走在了世界前列。”他说。
在武智院的操作平台上,王金桥给出了一张奔跑的小狗的照片,“紫东太初”立刻识别并描绘出照片中的景象:一只黑白相间的狗在铁轨上奔跑着,身后是绿色的树林。当他提出“以光谷为主题做首诗”时,“紫东太初”迅速地完成了一首七言绝句。
长江日报记者注意到,“紫东太初”被形象地设计成一个身穿汉服的小女孩,取名“小初”。
王金桥解释说,身穿汉服代表着“紫东太初”从算法到硬件、算力全栈国产化,全链条“中国造”;而小女孩则意味着国内的通用人工智能还处于刚刚起步的阶段,“和10多岁的孩子的能力差不多”。
上月举行的东湖算力与大数据创新大会上,基于“紫东太初”全模态大模型搭建的“紫东太初”大模型开放服务平台2.0正式发布。
该平台瞄准当前人工智能大规模应用难题,将全力推动人工智能在各行业的广泛应用,实现人工智能大模型高效落地、提升行业效率。
“在智能世界‘混沌初开’之际,希望‘紫东太初’的开放体验能够为用户打开一扇探索AI未来的大门。”王金桥介绍,该平台已于近日对外开放体验,用户可通过各种方式与AI进行交互,享受到更为便捷、高效的AI服务。
02
已在多个领域
形成规模化应用落地
光谷资本大厦内,中国光谷人工智能AI艺术展正在展出。在现场体验区,参观者只需要输入几个关键词或简单的文本描述,就能通过“江城洛神”人工智能内容创作平台生成一幅幅独一无二的绘画作品,实现“妙语生画”。“人工智能作为一种技术,和艺术有了越来越多的融合。”王金桥说。
“江城洛神”正是基于“紫东太初”大模型打造的人工智能内容创作平台,通过多模态技术实现图像编辑与生成,辅助内容生产,用户无需任何专业技能,只需轻轻一点,便可轻松创造出属于自己的艺术作品,可广泛运用于设计、影视、游戏等多个领域。
以室内装修设计领域为例,只需提供一张户型图,“江城洛神”就可自动生成多种装修设计样式,提示词越多、越精细,生成质量就越高,还能根据不同提示自动对结果进行编辑。
两周前,武汉市2023年数字经济应用场景“揭榜挂帅”揭榜项目名单公布,“紫东太初”大模型入选。
“‘紫东太初’大模型正赋能千行百业,推动数字经济全面发展。”王金桥介绍,“紫东太初”人工智能开放服务平台目前已成功应用于汽车制造质检、媒体信息服务、文化旅游、手语教育、纺织生产质检、医疗器械等10余个领域,形成规模化应用落地。
在智慧医疗领域,武智院联手九州通打造基于“紫东太初”大模型的医疗器械智能管理平台,自动识别管理2000多种医疗器械,能效提升30倍,精度实现99.9%,并将迅速推广到更多医院;
在法律咨询领域,“紫东太初”大模型仅需0.5秒就可完成案件的分析、拆解、定责,将法律案件研判的效率提升100倍左右;
在文化娱乐领域,“紫东太初”大模型变身“人工智能导师”,从科技角度对歌曲的审美和传播做出全新推荐,为歌唱比赛参赛歌手们提出个性化建议……
据介绍,截至目前,武智院已与湖北三环集团、湖北港口集团、九州通集团、光谷人才集团、武汉光庭等10余家单位在智能制造、智能网联汽车、智慧医疗、虚拟数字人等领域开展实质性合作,并与东风集团、湖北电信、湖北广电、长江通信、爱帝集团、集度汽车等40余家企业达成合作意向,助力数字经济与实体经济深度融合。
“人工智能未来的10年将是AIGC(Artificial Intelligence Generated Content,即生成式人工智能)的10年,如果说这个赛道有一万米,那么现在才刚刚跑了100米。”王金桥表示,未来,武智院还将围绕更多产业打造场景化模型和垂直类模型,推动“紫东太初”大模型在更多领域落地应用,“并借此不断提升大模型正确知识的学习能力和生成能力,使‘紫东太初’自身也不断地升级进化”。