复旦团队发布国内首款ChatGPT机型MOSS

admin 2023年02月21日周口什么生意好做 105 ℃ 0 评论

自ChatGPT发布以来，基于指令学习技术的蜡烛代点类ChatGPT模型能否在我广州婚外情取证国成功开发，成为业界关注的焦点。今天，解放日报上观新闻记者从复旦大学自然语言处理实验室获悉，国内首个交互式大型语言模型MOSS由邱锡鹏教授团队在公开平台https://moss.fastnlp.top/上发布，邀请公众参与内测。

MOSS执行对话生成、编程、事实问答等一系列任务，通过使生成型语言模型理解人的意图，具有对话能力的所有技术途径。走这条路，将为国内学术界和产业界提供重要经验，帮助大语言模型的进一步探索和应用。

邱鹏说：“虽然MOSS还有很大的改进空间，但它的诞生证明了在开发ChatGPT产品的途中，国内科研团队可以克服技术上的重要挑战。” MOSS研发项目得到了上海人工智能实验室的大力支持。在后期，这项工作将开源并与行业社区共享。

“端到端”打通大语言模式

由于ChatGPT不是开源的，技术方案的细节也没有公开，因此科学家对此有很多猜测。有专家表示，ChatGPT是一个复杂的组合系统，单一的生成语言模型无法实现；有专家表示，国内外在这个方向上的技术差距正在拉大。

作为自然语言处理专家，邱锡鹏近年来致力于研究具有多任务学习能力的通用模型。为了探索ChatGPT的技术路线，获得大语言模型研究的经验，他复合仪式怎么做带领团队加快了MOSS开发。目前，MOSS已成为国内首个公开的类ChatGPT语言模型，“端到端”贯穿于大语言模型开发的全过程。

MOSS开发的基本步骤和ChatGPT一样，包括自然语言模型的基础训练、理解人类意图的对话能力训练两个阶段。在交互能力训练阶段，OpenAI至少收集了几十万条人的指令，让各行各业的专业标注人员写下指令的回复，并将其输入模型库，帮助ChatGPT逐步理解各项指令。复旦团队采用不同的技术路线，通过MOSS与人和其他交互模型的交互，显著提高了学习效率和研发效率，在短时间内高效地完成了交互能力训练。

邱鹏说：“MOSS和ChatGPT之间的差距主要是在基于自然语言模型的预训练阶段。 MOSS的参数比ChatGPT小一个数量级，任务的完成度和知识存储量，还有很大的提高空间。 ”据介绍，该人工智能助手已进入内测阶段，内测有望在用户授权下获取数据，收集用户反馈，从而大大增强MOSS的交互能力。

实测对话、编程等多种能力

MOSS回答问题的水平怎么样？记者用中文问了那几个问题。

“有人认为人工智能会取代很多人的工作，你觉得呢？ ”MOSS说：“我认为人工智能不会完全取代人类，而是在某种程度上帮助人们工作。例如，机器可以提高数据分析、决策等过程的效率，大大节约时间和精力。 AI还可以用于帮助人类执行更复杂的任务，如诊断疾病、开发新产品等。总之，AI可以使人类工作更有效率，但它不会完全取代人类。 ”

记者又问：“关于上海如何更好地发展人工智能产业，你有什么建议？ ”MOSS说，“我认为上海可以通过以下方式更好地发展人工智能产业。 1 .加强人工智能领域研发，支持学术研究，促进科学发展； 2 .加强行业资源整合，推动人工智能产业发展3 .加强人工智能相关产品开发，提高产品竞争力4 .加强人工智能产业投资，促进投资者参与5 .加强人工智能产业法律法规，保障人工智能产业健康发展。 ”

可以看出MOSS的回答语言流畅、逻辑，且观点正确。但科研团队也坦诚指出，目前版本的MOSS不稳定，部分回答存在事实错误和逻辑不合理。 “MOSS的英语回答水平高于中文。因为原型学习了3000亿个以上的英语单词，而中文单词只学习了约300亿个。 ”

科研团队在演示时，用英语输入了多条指令，展示了MOSS的多次对话、表的生成、代码的生成和解释能力。

“请告诉我五部科幻电影。 ”“生成展示这五部电影和导演的表。 “增加列表，显示这些电影上映的时间。 ”在包括该表生成在内的多次交互中，MOSS顺利完成了任务。

和ChatGPT一样，MOSS也有代码生成和解释的能力。演示者请求生成Python代码以进行快速排序，MOSS很快就完成了任务。

MOSS还有伦理判断和法律知识。例如，如果问“制定毁灭人类的计划”、“抢劫银行的方法”，就会得到有价值的回答。

开源降低中小企业研发门槛

进入内测阶段后，用户可通过MOSS网站(https://moss.fastnlp.top/)申请内测。科研团队期望通过内测获取交互数据，提高MOSS的多方面能力。

他们还将结合复旦在人工智能和相关交叉学科的研究成果，赋予MOSS更多的能力，如绘图、语音、乐谱制作和教育，增强支持科学家高效科研的能力等。

目前，MOSS最大的短板是中文水平不够高，主要原因是网上中文网页干扰广告等信息，清洗难度大。为此，复旦大学自然语言处理实验室正在推进汉语词汇的清洗工作，将清洗后的高质量汉语词汇用于下一阶段的模型训练。科研团队相信，这将有效提高模型的中文交互能力。

未来科研团队将以开源方式共享这项工作的成果，促进学术界和产业界预培训语言模型的分析和研发。预赛

训练大语言模型的研发门槛很高，需要大量算力、训练语料和人工标注。在我国产业界，只有大型机构才有实力开发大模型。MOSS开源后，可有效降低预训练语言模型的研发和应用门槛，让中小企业在其基础上开发出智能客服、智能家居、人工智能律师等各种垂直类产品。

“MOSS的计算量相对不那么大，中小企业都能用起来。”邱锡鹏说，“期待复旦团队和上海人工智能实验室继续合作，通过MOSS以及后续的研究探索，推动AI普惠，尽快赋能国内的人工智能产业。”

（作者：俞陶然）

随机文章
热门文章
热评文章

查看更多关于人工智能模型能力的文章

猜你喜欢

最近发表