从信息学霸到神级科学家四爷的狗
第125章 你小子野心不小(第2页)
“这种训练方式虽然高效,但严格受限于数据,缺少泛化到其他问题的能力。”
“这就像是一个只会做题的学生,是无法灵活运用学到的知识解决新的问题的。”
一番话令在座教授们都惊愕万分。
他们浸淫信息学领域多年,同样被模型的泛化性问题困扰许久。
对于这个问题,学术界的主要解决办法是通过调整目标函数或是正则化的方式缩减模型的表达能力,以防止所谓的“过拟合”。
然而江铭却说,是因为整个人工智能的训练方式都是错的,才导致的泛化性问题?
王光伟也反复琢磨着刚刚江铭的发言,不敢随便下定论。
或许真的是这样?
“...我认为,人类的学习方式与现在的人工智能训练方式存在本质的不同。我将之总结为三点:无目标感知、多模态联想与思维预演。”
“目前屏幕上所展示的结构,就是我为了模仿人类的学习方式,所设计的超大规模人工智能模型。而它的训练方式,我称之为随机掩蔽双向自回归预测训练。”
台下仍旧没人说话,众人都在咀嚼着江铭刚刚抛出的陌生名词,他顿了顿,继续道。
“就像我们人类看到一段鸟群飞过的视频,即使遮住其中某些局部,或是拿掉其中几帧,大脑也有能力利用上下文信息把这些内容想象出来。”
“这种双向的联想能力才是人类学习的本质,而我构建的模型就是通过这种方式把文本、声音、图像甚至视频这些不同模态的信息聚合到同一个知识空间,使其涌现出真正的智能!”
“具体来说,算法通过类似完形填空的方式,随机掩蔽信息中的某些部分,并让模型根据过去与未来的信息对掩蔽部分进行预测。最终令人工智能足以聚合多个模态的知识,并产生媲美人的自主学习能力。”
江铭讲到这里就暂时停住了,他要给台下的教授们留出思考的时间。