OpenAI科学家告诉你:欲成伟业莫设目标

来源:江南体育注册平台    发布时间:2023-09-08 20:25:25

  从小我们就被灌输“有志者事竟成”“人无远虑,必有近忧”等古训,外国也有诸如“如果一艘船不清楚自己要驶向何方,那么什么风对它来说都不是顺风”的谚语。在真实的生活里,普罗大众也总是先规划自己的人生,无论是短期目标还是长期目标,然后按部就班一步步去实现它,直到人生的尽头。

  但有没有一种可能:所谓的目标其实根本就不存在,它只是一种模糊的感觉。一旦有了目标,反而会阻碍通往伟大的道路。

  提出这一观点的不是别人,正是近来火爆全球的OpenAI研究员、AI科学家。肯尼斯·斯坦利深耕机器学习领域多年,发表了80多篇专业论文,还曾是UberAI实验室的创始成员;乔尔·雷曼2022年率领的研究团队首度揭示了大模型的代码生成能力已足够影响智能体的进化,而这一进展反过来也能增强大模型的生成能力。他俩都是ChatGPT的核心研发科学家。

  其实中国的先贤并非忽略了这一现象,早就留下了“有心栽花花不开、无心插柳柳成荫”“欲速则不达”的箴言,包括“无为而治”的经验。但如何证明它并非偶然而是有其内在规律,甚至是一种必然?为何会导致这一现象的产生?两位作者通过大量例子包括实验试图对大家说:真正的大成就是计划不出来的,跟着好奇心一步一步走,才是成就非凡的正确路径。

  有意思的是,近年来“躺平”“佛系”“松弛感”越来越成为青年群体中的热门词汇,他们对于长远的规划不感兴趣,或者制定了也很难完成。本书显然不是迎合他们的理论依照,而是希望为社会进步提供另一种思路:将那些被“目标”捆绑住的创造力重新释放回人类手中。

  1.如果你是一个“胸无大志”的人,只想实现一些普普通通的小愿望,那么制定目标就会很有效。对于“高大上”的梦想,目标能提供的保证就有些无力了。

  2.对未知的机会秉持开放和灵活的态度,有时候比明确清楚自己要做什么更重要。每个人都有权追随人生的激情所在,即使它们偏离了最初的计划,或与最初的目标相冲突。

  3.不管看起来多么诱人、多么有说服力,遥远而宏伟的目标并不能指引你来到它的身边。宏伟的目标本身就是最不可靠的指南针。

  4.我们这样一个世界理想的运作方式与其真实的运作方式之间的脱节,是我们真正应该关注并担忧的问题。我们应该接受的现实是:很多事情是无法单纯通过努力实现的。

  5.设定目标意味着遵循一条未知的路径,朝着遥远的目的地前行,而新奇性只要求我们远离已经到过的地方。它不仅更简单轻松,还蕴含了更丰富的信息。

  6.每当有新的理论挑战主流的世界观时,人们自然会试图恢复旧有的秩序,而一个常见的办法就是通过重新解释新的理论以适应旧的思维模式,避免彻底地推倒重来。

  为什么伟大不能被计划?这个观念最初萌发于肯尼斯和乔尔的一个AI算法实验。

  假如你想从一些简单线条出发演化出好看的图片,或者让纸面上的机器人走出迷宫,或者让一个三维空间中的机器人学会直立行走,直觉上的做法是先设定AI算法的演化目标,在演化的每一步都进行筛选,接近目标就加分,否则就淘汰。但实验中这个做法的效果并不好。

  两位科学家发明的算法叫作“新奇性搜索”(Novel Search),这是他们2008年推出的。这种算法会随机生成一组解决方案,通过评估新奇性并保留新奇性比较高的方案,从而像生物演化一样发生一定的变异,如此往复循环,直到达到预定的迭代次数或者将问题彻底解决。

  这个算法在迭代过程中完全不考虑一个方案是否有利于接近目标,哪怕这个方案是机器人往墙上撞,或者一站起来就跌倒。产出的方案再怪异、再不靠谱也没关系,只要是新奇的就留下。实验证明,这种方法找出来的方案最能处理问题——它能生成最好看的图片,能最快找到迷宫的走法,能让机器人最快学会直立行走。

  这是为什么呢?一个原因便是求新就从另一方面代表着复杂。简单的方案总是先出现,把它们都尝试过之后还要新的,出来的就一定是更复杂的方案。复杂意味着掌握更多的信息,意味着更高级,也就更容易解决问题。

  更重要的原因是,新方案是通往其他新方案的“踏脚石”(Stepping Stones)。好比在迷雾中走路,看不清远处方向的时候,不断地收集、积累各个方向的踏脚石,自然而然地给自己更多的选择和方向,从而走出一条原来没办法想象的精彩的路。如果一开始就向着一个明确的目标努力,反而走不远。目标会窄化你的探索范围。对伟大事业来说,目标甚至具有误导性。

  比如教机器人直立行走。如果你一开始只想着直立行走,就会刻意避免能让机器人摔倒的方案。但恰恰是那些会摔倒的方案教会了机器人踢腿,而踢腿自然就容易摔倒,可是不踢腿怎么能会走呢?对新奇性搜索算法来说,机器人从“不会摔倒”到“会摔倒”,绝对是大好事,机器人会的慢慢的变多就从另一方面代表着越来越高级,自然会将直立行走这项技能收入囊中。

  考察科技发展史,好东西从来都不是按照某个目标刻意计划出来的,而是一个接一个自动发展出来的:莱特兄弟发明飞机,最早用的是自行车技术;本来是用于驱动雷达磁控管的一个部件,意外成就了微波炉;第一台电子计算机用的是电子管,但电子管根本就不是为了计算机而发明的;YouTube最初的设想是一个视频约会网站,后来发现人们喜欢在上面分享五花八门的视频;比尔·盖茨迎合极客打游戏的需求,结果普及了个人电脑;埃隆·马斯克起家是网上支付,最后却推出了SpaceX和特斯拉……

  伟大不是目标指引的结果,因为通往伟大的路线从来都不是直线,很多时候快反而就是慢——没有特殊目标,每次只是选择下一块踏脚石,你反而能找到珍宝。

  ChatGPT无疑是近年来最令科技界侧目的伟大发明创新,它甚至被誉为“可能是工业革命以来最了不起的发明之一”。

  2022年11月底,由OpenAI研发的人工智能对话聊天机器人ChatGPT横空出世,迅速在社会化媒体上走红,短短5天注册用户数就超过100万。截至2023年1月末,ChatGPT的月活用户已突破1亿,成为史上增长最快的消费者应用。

  更令人惊讶的是,OpenAI的四位领导人都是三四十岁的年纪,它在最初并未得到美国政府的特别关注。两位没有学位的美国人和两位外国移民,领着几十位研发人员组成了一家小公司,采用了一个当初包括谷歌在内的大公司都不看好的技术路线,搞出了最震撼的科技产品。

  对比之下,那些由政府从上而下主持的大科研项目呢?1971年,时任美国总统尼克松发起一场“癌症战争”,但貌似什么都没干出来;1982年,日本通商产业省搞了一个为期10年的大项目,投入巨资,要研发第五代计算机系统,也是没有突破出来。

  这个道理并不是新认知,但是想要说服掌握充足资源的政策主导者谈何容易。我们常见的科学技术创新路数大多是这样的:选定若干战略方向、投入巨额研发资金、组织聪明的科研工作者、定期考核监督进度……但结果为什么总是“播下龙种、收获跳蚤”呢?

  后发优势理论认为,通过引进、模仿、学习前人的技术和制度,能够得到利益,从而具有优势。客观上由于学习成本大大低于创新成本,过去一些国家一度取得了显著的成绩,但客观上也限制了它们寻找“踏脚石”的能力。一旦科技领域进入无人区,前面没有现成的路,那种认准一个方向猛干、不惜成本投入人力物力、指望大力出奇迹的做法就行不通了。

  创新是一件神奇的事情。要知道,一些实现伟大成就的发明家并非比同行更勤奋、更努力,而是因为他们经常能捡到“意外的”宝藏。在科学技术的探索过程中,依照目标所建立的各项方案纷繁复杂,目标的轻松提出与为实现其而付出的努力不再相称,甚至渐行渐远。

  对目标的深度迷恋甚至已经给社会带来了危害:目标导向的评价标准让有创造力的东西越来越机械、标准化考试让老师只会选择应试型教学、短期内大幅度提高GDP反而会削弱民众的福祉……有时候,我们应该通过放弃目标带来的虚假安全感,摆脱对停滞不前的方式的固守。

  经济学家朱嘉明认为,人类正处于信息和知识大爆炸,以及人工智能主导科技革命持续加速的历史阶段,传统的线性和基于经验的思维模式被全面解构,预测动态和多维的平行世界发展的新趋势就没有可能。特别是AIGC所代表的人工智能意志,不会完全被人类选择的“目标”所束缚。所以,在这样的时代,人们原本熟知的“系统”和“框架”概念正在急速过时,任何伟大的成功只能发生在“小概率”领域,需要以废弃传统的目标设计为前提。未来只能属于那些敢于突破“目标”幻想和挣脱“目标”幻觉枷锁的人。

  正如肯尼斯所言:我们已太习惯于通过“目标”来界定所有的努力,甚至忘了我们大家可以去质疑目标的价值。我们的文化为了所谓的“目标”已经牺牲了太多,现在我们要做的就是悉数夺回。返回搜狐,查看更加多


江南体育注册平台

了解最新动态,关注微信公众号!