当前位置:网站首页 / 周口什么生意好做 / 正文

复旦团队发布国内首款ChatGPT机型MOSS

admin 2023年02月21日 周口什么生意好做 105 ℃ 0 评论

自ChatGPT发布以来,基于指令学习技术的蜡烛代点类ChatGPT模型能否在我广州婚外情取证国成功开发,成为业界关注的焦点。 今天,解放日报上观新闻记者从复旦大学自然语言处理实验室获悉,国内首个交互式大型语言模型MOSS由邱锡鹏教授团队在公开平台https://moss.fastnlp.top/上发布,邀请公众参与内测。

复旦团队发布国内首款ChatGPT机型MOSS

MOSS执行对话生成、编程、事实问答等一系列任务,通过使生成型语言模型理解人的意图,具有对话能力的所有技术途径。 走这条路,将为国内学术界和产业界提供重要经验,帮助大语言模型的进一步探索和应用。

邱鹏说:“虽然MOSS还有很大的改进空间,但它的诞生证明了在开发ChatGPT产品的途中,国内科研团队可以克服技术上的重要挑战。” MOSS研发项目得到了上海人工智能实验室的大力支持。 在后期,这项工作将开源并与行业社区共享。

“端到端”打通大语言模式

由于ChatGPT不是开源的,技术方案的细节也没有公开,因此科学家对此有很多猜测。 有专家表示,ChatGPT是一个复杂的组合系统,单一的生成语言模型无法实现; 有专家表示,国内外在这个方向上的技术差距正在拉大。

作为自然语言处理专家,邱锡鹏近年来致力于研究具有多任务学习能力的通用模型。 为了探索ChatGPT的技术路线,获得大语言模型研究的经验,他复合仪式怎么做带领团队加快了MOSS开发。 目前,MOSS已成为国内首个公开的类ChatGPT语言模型,“端到端”贯穿于大语言模型开发的全过程。

MOSS开发的基本步骤和ChatGPT一样,包括自然语言模型的基础训练、理解人类意图的对话能力训练两个阶段。 在交互能力训练阶段,OpenAI至少收集了几十万条人的指令,让各行各业的专业标注人员写下指令的回复,并将其输入模型库,帮助ChatGPT逐步理解各项指令。 复旦团队采用不同的技术路线,通过MOSS与人和其他交互模型的交互,显著提高了学习效率和研发效率,在短时间内高效地完成了交互能力训练。

邱鹏说:“MOSS和ChatGPT之间的差距主要是在基于自然语言模型的预训练阶段。 MOSS的参数比ChatGPT小一个数量级,任务的完成度和知识存储量,还有很大的提高空间。 ”据介绍,该人工智能助手已进入内测阶段,内测有望在用户授权下获取数据,收集用户反馈,从而大大增强MOSS的交互能力。

实测对话、编程等多种能力

MOSS回答问题的水平怎么样? 记者用中文问了那几个问题。

“有人认为人工智能会取代很多人的工作,你觉得呢? ”MOSS说:“我认为人工智能不会完全取代人类,而是在某种程度上帮助人们工作。 例如,机器可以提高数据分析、决策等过程的效率,大大节约时间和精力。 AI还可以用于帮助人类执行更复杂的任务,如诊断疾病、开发新产品等。 总之,AI可以使人类工作更有效率,但它不会完全取代人类。 ”

记者又问:“关于上海如何更好地发展人工智能产业,你有什么建议? ”MOSS说,“我认为上海可以通过以下方式更好地发展人工智能产业。 1 .加强人工智能领域研发,支持学术研究,促进科学发展; 2 .加强行业资源整合,推动人工智能产业发展3 .加强人工智能相关产品开发,提高产品竞争力4 .加强人工智能产业投资,促进投资者参与5 .加强人工智能产业法律法规,保障人工智能产业健康发展。 ”

可以看出MOSS的回答语言流畅、逻辑,且观点正确。 但科研团队也坦诚指出,目前版本的MOSS不稳定,部分回答存在事实错误和逻辑不合理。 “MOSS的英语回答水平高于中文。 因为原型学习了3000亿个以上的英语单词,而中文单词只学习了约300亿个。 ”

科研团队在演示时,用英语输入了多条指令,展示了MOSS的多次对话、表的生成、代码的生成和解释能力。

“请告诉我五部科幻电影。 ”“生成展示这五部电影和导演的表。 “增加列表,显示这些电影上映的时间。 ”在包括该表生成在内的多次交互中,MOSS顺利完成了任务。

和ChatGPT一样,MOSS也有代码生成和解释的能力。 演示者请求生成Python代码以进行快速排序,MOSS很快就完成了任务。

MOSS还有伦理判断和法律知识。 例如,如果问“制定毁灭人类的计划”、“抢劫银行的方法”,就会得到有价值的回答。

开源降低中小企业研发门槛

进入内测阶段后,用户可通过MOSS网站(https://moss.fastnlp.top/)申请内测。 科研团队期望通过内测获取交互数据,提高MOSS的多方面能力。

他们还将结合复旦在人工智能和相关交叉学科的研究成果,赋予MOSS更多的能力,如绘图、语音、乐谱制作和教育,增强支持科学家高效科研的能力等。

目前,MOSS最大的短板是中文水平不够高,主要原因是网上中文网页干扰广告等信息,清洗难度大。 为此,复旦大学自然语言处理实验室正在推进汉语词汇的清洗工作,将清洗后的高质量汉语词汇用于下一阶段的模型训练。 科研团队相信,这将有效提高模型的中文交互能力。

未来科研团队将以开源方式共享这项工作的成果,促进学术界和产业界预培训语言模型的分析和研发。 预赛

训练大语言模型的研发门槛很高,需要大量算力、训练语料和人工标注。在我国产业界,只有大型机构才有实力开发大模型。MOSS开源后,可有效降低预训练语言模型的研发和应用门槛,让中小企业在其基础上开发出智能客服、智能家居、人工智能律师等各种垂直类产品。

“MOSS的计算量相对不那么大,中小企业都能用起来。”邱锡鹏说,“期待复旦团队和上海人工智能实验室继续合作,通过MOSS以及后续的研究探索,推动AI普惠,尽快赋能国内的人工智能产业。”

(作者:俞陶然)

  • 随机文章
  • 热门文章
  • 热评文章

查看更多关于人工智能模型能力的文章

猜你喜欢

最近发表
标签列表