“原来如此。”李睿和妲露拉明白了。
看来不是复印机成精了,还是内部程序的设计有问题。
看上去,一台复印机疑似成精的故事和人工智能之间没什么直接联系,复印机内部采用的压缩技术,才是这个故事的关键。
特德姜继续道“大卫把这个问题指出来,并且联系了施乐的工程师,想必他们很快就会通过补丁来解决这个bug,而我则从这个故事中,发散想到了其他的问题。我们一直认为复印机只是完整的复制原件,但在数字时代,它却采用了一种微妙而模糊的方式来解决复制问题,它制造的副本看起来准确,实际上并不准确。我们正在研究的人工智能,是不是也可以采用类似的方式来发展呢”
“发展不准确的复制”妲露拉惊讶的问道。
特德姜笑了“当然不是。”
他顿了顿解释道“据我所知,微软谷歌还有其他一些公司正在研究语言模型,希望人类和机器能够通过某种方式进行沟通和对话,这就需要为机器准备极为庞大的数据库,最好是能够把整个万维网储存下来供机器调用。”
“那是不可能的。”妲露拉摇头道。
特德姜道“确实不可能,但如果是采用压缩技术,尤其是有损压缩的技术,还是有可能的。这需要编写一个有损算法来识别所有数据中的统计规律,就可以把所有数据信息储存下来,供机器学习和使用。唯一的问题是,由于数据被高度压缩,机器无法通过搜索准确的引用来查找信息,就无法得到一个精确的匹配,只能通过一些要点来进行响应。”
“chat不,应该是问心义言”李睿小声咕哝着。
“你说什么”特德姜问。
李睿摇头道“没什么。”心中却翻滚着巨浪,原来这么早就有人提出了类chat的概念了。
特德姜继续道“我相信通过类似的技术,人类会在不久的将来得到一种能够对话的人工智能,它保留了万维网上绝大部分的信息,但它无法精确的回答一个问题,而只能在数据库中搜索到一个近似值,再用独特的创建语法文本的技术来展现答案。这个答案会让你觉得还不错,但仔细思考的话,其实经不起推敲,这就是人工智能会在压缩、搜索、展现环节遇到的关键问题,谁能先解决这些问题,谁就有可能在这个领域先行一步。”
十年后,当最初的一批人工智能模型出现时,有的技惊四座,比如chat,有的丢人现眼,比如问心义言。
前世李睿其实不清楚他们的差距到底在什么地方,现在听了特德姜的讲解,才大概有了一些了解。
问心义言那种乱七八糟的回答不知是哪个环节出现了问题,但chat确实在数据的采用和文本的创建上有独特的技术,也就难怪一问世就让所有人目瞪口呆了。
刘玉琨一旁道“我的想法是,人类永远都应该更相信自己,而不是压缩之后又复制的人工智能。”
李睿点头。
chat的确令人惊艳,但最初的几个版本依然存在大量问题,很多问题看起来回答的十分精彩,可如果认真搜集资料对比的话,会发现其中