自ChatGPT发布以来,基于指令学习技术的蜡烛代点类ChatGPT模型能否在我广州婚外情取证国成功开发,成为业界关注的焦点。 今天,解放日报上观新闻记者从复旦大学自然语言处理实验室获悉,国内首个交互式大型语言模型MOSS由邱锡鹏教授团队在公开平台https://moss.fastnlp.top/上发布,邀请公众参与内测。
MOSS执行对话生成、编程、事实问答等一系列任务,通过使生成型语言模型理解人的意图,具有对话能力的所有技术途径。 走这条路,将为国内学术界和产业界提供重要经验,帮助大语言模型的进一步探索和应用。
邱鹏说:“虽然MOSS还有很大的改进空间,但它的诞生证明了在开发ChatGPT产品的途中,国内科研团队可以克服技术上的重要挑战。” MOSS研发项目得到了上海人工智能实验室的大力支持。 在后期,这项工作将开源并与行业社区共享。
“端到端”打通大语言模式
由于ChatGPT不是开源的,技术方案的细节也没有公开,因此科学家对此有很多猜测。 有专家表示,ChatGPT是一个复杂的组合系统,单一的生成语言模型无法实现; 有专家表示,国内外在这个方向上的技术差距正在拉大。
作为自然语言处理专家,邱锡鹏近年来致力于研究具有多任务学习能力的通用模型。 为了探索ChatGPT的技术路线,获得大语言模型研究的经验,他复合仪式怎么做带领团队加快了MOSS开发。 目前,MOSS已成为国内首个公开的类ChatGPT语言模型,“端到端”贯穿于大语言模型开发的全过程。
MOSS开发的基本步骤和ChatGPT一样,包括自然语言模型的基础训练、理解人类意图的对话能力训练两个阶段。 在交互能力训练阶段,OpenAI至少收集了几十万条人的指令,让各行各业的专业标注人员写下指令的回复,并将其输入模型库,帮助ChatGPT逐步理解各项指令。 复旦团队采用不同的技术路线,通过MOSS与人和其他交互模型的交互,显著提高了学习效率和研发效率,在短时间内高效地完成了交互能力训练。
邱鹏说:“MOSS和ChatGPT之间的差距主要是在基于自然语言模型的预训练阶段。 MOSS的参数比ChatGPT小一个数量级,任务的完成度和知识存储量,还有很大的提高空间。 ”据介绍,该人工智能助手已进入内测阶段,内测有望在用户授权下获取数据,收集用户反馈,从而大大增强MOSS的交互能力。
实测对话、编程等多种能力
MOSS回答问题的水平怎么样? 记者用中文问了那几个问题。
“有人认为人工智能会取代很多人的工作,你觉得呢? ”MOSS说:“我认为人工智能不会完全取代人类,而是在某种程度上帮助人们工作。 例如,机器可以提高数据分析、决策等过程的效率,大大节约时间和精力。 AI还可以用于帮助人类执行更复杂的任务,如诊断疾病、开发新产品等。 总之,AI可以使人类工作更有效率,但它不会完全取代人类。 ”
记者又问:“关于上海如何更好地发展人工智能产业,你有什么建议? ”MOSS说,“我认为上海可以通过以下方式更好地发展人工智能产业。 1 .加强人工智能领域研发,支持学术研究,促进科学发展; 2 .加强行业资源整合,推动人工智能产业发展3 .加强人工智能相关产品开发,提高产品竞争力4 .加强人工智能产业投资,促进投资者参与5 .加强人工智能产业法律法规,保障人工智能产业健康发展。 ”
可以看出MOSS的回答语言流畅、逻辑,且观点正确。 但科研团队也坦诚指出,目前版本的MOSS不稳定,部分回答存在事实错误和逻辑不合理。 “MOSS的英语回答水平高于中文。 因为原型学习了3000亿个以上的英语单词,而中文单词只学习了约300亿个。 ”
科研团队在演示时,用英语输入了多条指令,展示了MOSS的多次对话、表的生成、代码的生成和解释能力。
“请告诉我五部科幻电影。 ”“生成展示这五部电影和导演的表。 “增加列表,显示这些电影上映的时间。 ”在包括该表生成在内的多次交互中,MOSS顺利完成了任务。
和ChatGPT一样,MOSS也有代码生成和解释的能力。 演示者请求生成Python代码以进行快速排序,MOSS很快就完成了任务。
MOSS还有伦理判断和法律知识。 例如,如果问“制定毁灭人类的计划”、“抢劫银行的方法”,就会得到有价值的回答。
开源降低中小企业研发门槛
进入内测阶段后,用户可通过MOSS网站(https://moss.fastnlp.top/)申请内测。 科研团队期望通过内测获取交互数据,提高MOSS的多方面能力。
他们还将结合复旦在人工智能和相关交叉学科的研究成果,赋予MOSS更多的能力,如绘图、语音、乐谱制作和教育,增强支持科学家高效科研的能力等。
目前,MOSS最大的短板是中文水平不够高,主要原因是网上中文网页干扰广告等信息,清洗难度大。 为此,复旦大学自然语言处理实验室正在推进汉语词汇的清洗工作,将清洗后的高质量汉语词汇用于下一阶段的模型训练。 科研团队相信,这将有效提高模型的中文交互能力。
未来科研团队将以开源方式共享这项工作的成果,促进学术界和产业界预培训语言模型的分析和研发。 预赛
训练大语言模型的研发门槛很高,需要大量算力、训练语料和人工标注。在我国产业界,只有大型机构才有实力开发大模型。MOSS开源后,可有效降低预训练语言模型的研发和应用门槛,让中小企业在其基础上开发出智能客服、智能家居、人工智能律师等各种垂直类产品。“MOSS的计算量相对不那么大,中小企业都能用起来。”邱锡鹏说,“期待复旦团队和上海人工智能实验室继续合作,通过MOSS以及后续的研究探索,推动AI普惠,尽快赋能国内的人工智能产业。”
(作者:俞陶然)