第391章【智能平板推出在即】(2 / 3)

的对话内容往往没有什么意义,大多数情况对现实世界没有常识和基本知识,局限于感知领域,此外,对于当前的语境往往给不出恰到好处的特定回复。”

李淳胜点点头,认同的说道:“对,例如‘我不知道’确实是一个可以回答任何问题的答复,但是不够详细。大数据显示,当前版本的小蓝产生这种回复的频率比人类要高很多,因为这种回复可以覆盖很多可能的用户输入。”

罗晟让人打开了会议室里的大屏幕,然后连接自己的工作电脑,一番迅速操作便示意与会的所有人看向大屏幕。

“这是一个端到端的神经对话模型,可以学习如何对给定的对话上下文做出响应,训练小蓝的目标是最大程度的减少困惑度。以及预测下一个标记的不确定性。其核心为EvolvedTransforrseq2seq架构,也就是通过进化神经架构搜索发现一种Transforr体系结构,可以改善困惑度。”

罗晟调出一组新的信息面板,补充道:“小蓝由ET编码器和13个ET解码器组成,编码器用于处理对话语境,帮助小蓝理解对话中已经说过的内容,解码器则是利用这些信息生成实际的回复。”

与会的一位AI技术研究员凝视着大屏幕里的面板信息自言自语的说道:“通过超参数调整后,性能更强的解码器是实现高质量对话的关键。”

罗晟看向那位研究员干脆利落的点名:“很好,这一块你来搞定。”

“好的老大,但我需要权限。”

罗晟点点头,在自己的电脑上敲打了几下:“授权了。另外这是一个有着52亿参数的端到端神经对话模型,值得注意的是,困惑度,这是一个很容易在各种神经对话模型中实现的计算指标,这里有一份数据。”

众人一听再次看向会议室里的大屏幕。

罗晟说道:“困惑度指标。由于人类评价存在的问题,一个能够自动计算的评价指标很重要,这个指标需要能够和人类评价精确对应。这里有8个不同的模型版本,分别有着超参数和架构上的区别,如层数、注意力head数量、训练步数。用的还是ET,还是一般的Transforr,从这份数据来看,越低的困惑度模型有着更高的得分,两者的相关系数很强。”

研讨会议并没有持续太长的时间,坐在这里的都是一群高智商的开发者,罗晟也不是一个拖泥带水的人,迅速敲定各大环节,技术团队也就进入下一个开发进程当中。

按照既定的计划,罗晟带领团队继续通过改进算法、架构、数据和计算量去降低神经对话模型的困惑度。

罗晟在蔚蓝海岸实验室滞留了两个多小时便回到了自己的办公室,并且把姚建鸿喊来。

……

“罗总,有什么吩咐?”

姚建鸿进入了罗晟的办公室,后者放下手头的工作,琢磨了片刻便说道:“智能平板即将推出,技术问题基本上已经搞定,现在就差内容配套要跟上了。你去办几件事情,第一件事情给维基百科捐助1000万美元,这里的海量数据我们需要获取,另外就是准备10亿美元与全球的顶级学术期刊、大学合作,获得他们的知识库授权,最晚两个月搞定。”

除了这些,还需要更多的数据授权,罗晟当然不会放过蓝星科技庞大的数据库资源了,不过也不能白给,虽然两家公司都是自己创建的,但是蔚蓝海岸依然的向蓝星科技购买数据。

这里大约需要30亿美元的样子,然后获得在线翻译的接入权限,打通这一环节,完成整合。

姚建鸿点头:“没问题,交给我吧。”

教育辅助工具“智能平板”项目是蔚蓝海娜公司上半年的重点推出的新产品。

罗晟补充道:“另外在额外准备15亿美元左右的开支预算,这笔钱用于招