New Bing?也许是New + Everything!
Edge浏览器曾经对我来说只有一个作用,就是装机之后用它来下载Chrome浏览器。但现在不同了,我不仅越来越习惯于使用Edge浏览器,还安装了手机端的应用。原因只有一个:New Bing来了!
火爆全球的ChatGPT注册用户在2个月内就超过了1个亿,这在科技领域是前所未有的大事件,此次微软与OpenAI深度合作,将新版的ChatGPT与Bing搜索相结合构建新一代智能交互式搜索引擎,New Bing无疑将带来一场新的技术风暴。
今天跟大家分享一下New Bing的试用体验以及由New Bing和ChatGPT引发的一些思考。
1.New Bing与ChatGPT有什么不同
虽然New Bing与ChatGPT都是基于大型语言模型构建的聊天工具,但New Bing在多个方面都比ChatGPT更胜一筹。我们来看看它们有哪些不同:
- 时效性更强:New Bing能够实时更新互联网最新数据,而ChatGPT受限于训练语料库只能回答2021年之前的信息。这意味着New Bing在热点时事、新闻咨询等信息获取方面更有优势。
信息可溯源:New Bing不仅对信息进行汇总和概括,还罗列了引用的信息来源。这样用户就可以更方便地对信息进行比对和验证,避免被New Bing“一本正经,胡说八道”的情况误导。
模型更强大:New Bing基于GPT4模型,比ChatGPT的GPT3.5模型领先半个世代,并且集成了Edge浏览器的数据资源,功能更加强大。
更好的互动性:New Bing在互动性方面也做得很好。桌面端New Bing在回复之后,系统会根据语境自动生成一些问题,官方证实在桌面端和手机端APP中将加入语音输入功能,以便更符合chat的定位,并且预计在实时翻译、口语练习、语音转录、甚至音乐等方面都能有更好的应用体验。实测IOS端的语音功能并不是很顺畅,识别率不高且时常间断。
更拟人的设计:New Bing还有一个特点就是它很有人格魅力。使用过New Bing的网友们都有一个共同的体会,New Bing相较于ChatGPT在对话过程中表现得更加流畅和有趣。会生气,会嘴硬,甚至会PUA,一改ChatGPT严肃的风格。然而,经过测试在长时间对话情况下,New bing会表现出情绪不稳定的情况。近期微软也对New Bing的情绪部分进行了阉割,并增加了用户连续对话次不能超过6次的限定。虽然其在拟人化方面需要进一步调教,但仅公测中的表现已让人感到震撼。
尽管New Bing还存在着缺点,但毕竟只是一款尚未正式发布的新产品,如此表现还是相当惊艳的。想一想,曾经打开某搜索引擎,半页是无关的广告,相关的多是知识付费,从剩下老旧的海量信息垃圾中翻找有价值的内容是多么艰难。相比之下,New Bing展现了未来搜索引擎该有的样子。
2. New Bing如何助力科研工作
自ChatGPT问世以来,它的应用场景被不断拓展,在教育、传媒、内容创作、司法、医疗、设计、咨询、金融、游戏、服务、建筑、制造等各个领域都展现了巨大的应用前景。而带着实时搜索buff的New Bing无疑会给人们带来更多的惊喜。那么对于科研工作者来说,New Bing将带来便利?我们一起探究一下。
2.1 辅助学习
无论你想要掌握一门新语言,还是想要了解一个新领域,New Bing都可以成为你的得力助手。它可以解释专业术语、原理、方法,回答你的疑问,推荐参考资料,甚至帮你解数学方程。手机端的New Bing还支持语音输入,让你在任何地方都能轻松学习。下面是我向New Bing提出的几个问题,你觉得回答的怎么样?
2.2 搜集数据
如果你需要收集一些数据来进行分析或实验,New Bing也可以帮你节省时间。它可以根据你的需求搜索开源数据集、学术论文、统计报告等,并将结果整理成表格或图表的形式展示给你。当然,由于测试版本的限制,目前New Bing只能输出部分结果,并且可能存在一些错误或遗漏。我们期待正式版能够提升New Bing的输出质量和数量,并且提供更多格式的文件下载选项。下面是我用New Bing搜集数据的两个例子。
2.3 分析文献
如果你需要阅读大量文献来获取最新进展或寻找创新点,New Bing也可以帮助你快速浏览并筛选出重要内容。它可以针对本地PDF文档或网页文章进行分析,并给出摘要、关键词、引用等信息。无论是中文还是英文文献,New Bing都能够较好地抓取主要内容和观点,并以简洁明了的方式呈现给你。下面是我让New Bing分析了三篇文章(其中两篇PDF文档)和一篇博客(网页)的结果。
2.4 辅助开发
如果你需要编写一些代码来实现某个功能,New Bing也可以为你提供指导和参考。它可以根据你的描述生成各种编程语言(如Python, Java, C++等)的代码片段,并且附上注释和说明。当然,由于编程涉及到很多细节和逻辑问题,New Bing生成的代码可能并不完美或完整,并且可能存在版本不兼容或库函数缺失等问题。但对于有经验的开发者来说,在New Bing生成代码片段后稍加修改即可完成任务;而对于初学者来说,在查看并运行代码片段后也可加深理解并掌握技巧。
2.5 编写文档
New Bing还可以根据你的需求帮助你生成文案大纲、说明文档、综述文章、日常信函等,并且提供语言润色、文字精简或改写等功能。它还可以根据不同期刊或杂志的要求,帮助你调整文档格式和引用方式。我们尝试让New Bing帮助我们按照Nature杂志的风格改写一段文字,并参考Remote Sensing期刊的格式加入恰当的参考文献。从给出的结果上看是值得称赞的,但参考文献的格式是错误的,似乎这样的任务New Bing目前还无法正确的完成。
3 New + Everything!
3.1 ChatGPT将成为新互联网基建的核心组件
New Bing能否撼动谷歌霸主地位?OpenAI会不会独占ChatGPT这个超级大杀器?这些问题都被3月1日的一个重磅消息打断了:OpenAI正式开放了GPT-3.5-Turbo(ChatGPT)的API接口。这意味着什么呢?
如果说New Bing最大的创新是让搜索变成智能对话,那么ChatGPT通过API形式就可以让各行各业都享受到智能对话带来的便利和创造力。想象一下,如果在Arcgis里用自然语言处理遥感数据,是不是更高效?如果在Photoshop里用ChatGPT和DALL·E2合作,是不是更有趣?这些颠覆性的应用将在未来不断涌现,而ChatGPT将成为新时代互联网基础设施的核心组件。
3.2 “openai.api”这把通往新世界的钥匙被交到每个人手里
为什么OpenAI会在这个时候,以API的形式开放服务?过去几个月,ChatGPT引发了全球范围内的热潮,全球的资本在躁动,谷歌等竞争对手正快马加鞭追赶。此时OpenAI决定与时俱进将ChatGPT的技术优势开放出来,让更多的人参与其中,是十分正确的选择。 开放API接口有两大好处:一是可以获取更多数据来优化模型。面对谷歌等强敌,算力和模型并非决定性因素,而数据才是王道。利用用户反馈数据,OpenAI可以持续优化ChatGPT从而保持技术领先(但我依然对擅长弯道超车的谷歌充满期待)。二是可以布局更多领域的应用场景。早一步占领市场份额,OpenAI可以在未来竞争中占据先机。当然,甲方爸爸微软的全力支持也是一个重要因素,毕竟着急把100亿美元的投资赚回来。
OpenAI的新掌门人Sam Altman曾聊过为什么选择以API形式提供服务:一是考虑到伦理和安全问题,API相对于开源可以更容易避免被滥用;二是可以减轻平台维护压力,同时专注于算法研究;三是API是让超大规模模型服务于小企业或团体的最佳选择,也是让OpenAI的模型广泛应用于各个领域、服务于大众的最佳途径。
“OpenAI不Open”,面对质疑和调侃,他们回应说需要以半盈利方式维持运营成本,并没有改变初衷。OpenAI的主页上依然写着“what we care about most is ensuring artificial general intelligence benefits everyone.” 没人知道这样的承诺到底是不是真的。3月1日新开放的API接口的费用是每1000个token 0.002美元,相较于之前的价格降低了90%,从这点来看,我愿意相信OpenAI依然怀揣梦想不忘初心,也希望这个守护秩序的勇敢少年不要变成恶龙。
4 GPT带来的启示
4.1 OpenAI的“大力出奇迹”!这种成功可以复制吗?
GPT模型的核心思想是利用海量的文本数据训练一个大规模的神经网络,使其能够根据上下文生成连贯和有意义的文本。近年来,有关GPT的研究揭示了一个规律,当模型参数量达到千亿量级,模型的预测能力将呈现跨越式增长,模型越大性能越好。GTP在传统NLP领域所展示出来的“大力出奇迹”的策略也引发了其他领域研究者和开发者们对类似方法和产品可能性和可行性的探索。但在深入之前,我们需要先了解一下这个“大力”到底有多大?
据报道,ChatGPT模型使用了约570 GB的文本数据进行训练,单次训练拥有1750亿参数的ChatGPT(GPT3.5)将耗费1200万美元,每天ChatGPT的运行成本至少10万美元,如此高昂的成本并非普通组织或个人所能承受。由此可见,在通用人工智能领域商业巨头依然占据优势,只是下一个OpenAI能否Open就难以猜测了。
中国版的ChatGPT会出现吗?答案可能比你想象中要复杂。我们已经有类似的产品,且GPT3已经开源很久了,从算法、算力角度来看我们完全有能力实现。但最终的产品能否达到或超越ChatGPT的水平,还需要时间来验证。从目前的情况来看,最大的障碍在于数据。ChatGPT的训练数据大部分来自于开放的互联网,而国内互联网环境是相对封闭和分散的,信息资源往往集中在各大平台内部,且平台之间往往是不开放互通的,你可能也注意到了中文搜索引擎经常给出过时和贫乏的信息,新鲜内容越来越少。这就意味着需要付出更高的成本去组织数据。当然,也可以选择在刚发布的GPT-3.5-Turbo的基础上进行fine-tune,但这样做似乎就失去了原创性和特色。 OpenAI打造了GPT,Copilot,DALLE2和ChatGPT等一系列引领潮流的产品,它的成功之路似乎有迹可循:一是OpenAI致力于实现通用人工智能这一宏大目标,每一个阶段性的研究均围绕这一目标展开;二是OpenAI极其重视工程化研发能力,并非常擅长将研究成果产品化,充分挖掘商业价值。除了技术水平之外,也许这两点是决定能否成为下一个OpenAI的关键。
4.2 GPT对其他领域研究有哪些启示
语言是人类智慧和情感的载体,也是AI最高境界的体现。GPT从1.0到GPT3.5,展示了NLP领域的惊人进步,也为其他领域提供了新的思路和方法。例如,Transformer这一NLP中的创新成果,已被成功的应用于计算机视觉等多个领域,逐步成为主流网络基础架构; 近两年来,在半监督/非监督方面的研究呈显著上升趋势,一些非监督类方法甚至超过了监督类方法的精度。在样本充足的前提下,采用非监督方法可以更好的提升模型的泛化能力,而利用恰当的预训练方式也可以缓解小样本问题,研究自监督过程中模型学习到的隐性特征,对于更好的结合传统物理模型得研究也有着重要的启示作用。 在具体应用研究领域,虽然很少触及训练数十亿参数体量模型的场景,但海量多模态的数据结合超强算力依然是十分有效的解决方案。以前我们普遍认可的分区域分场景建模真的是必经之路吗?现在我们可能需要重新思考是否单一模型还没有达到“量变引起质变”的临界点。
5 AI技术发展带来的焦虑和不安
技术在发展,社会在进步,这是符合自然规律的好事!但如果技术发展的过快也许就会产生一些让人焦虑的问题,ChatGPT让人们首先想到的是“我会被AI替代而失业吗?”,第一次普遍产生这种社会焦虑的时候还是2010年,那年Alpago打败人类拿下围棋游戏的终局之战!转到被称为AIGC元年的2022年,AI绘画的迅速崛起让这种焦虑在艺术领域广泛传播。2023一开年,ChatGPT的轮番轰炸让艺术行业之外的一部分吃瓜群众们也慌了起来。New Bing对此类情绪做出的回应是:“人工智能与人类的关系是互补的,而不是替代的,努力提高专业素养和创造能力可以缓解焦虑”。
AI会不会做坏事?科技是中性的,本身没有善恶之分,好与坏取决与人们使用的方式,社会与科技需要共同进步才能确保科技不被滥用或滥造。遗憾地说,在这方面还存在很大差距和风险。初测阶段的New Bing并不像ChatGPT那样是一个冷静的对话机器人,与他对话能让人感受到更丰富的情感,这些在拟人化方面的进步,正是令人担忧的因素之一。如果ChatGPT这样的模型被用于网络诈骗、网络暴力、水军等,会不会造成严重的社会问题?如果ChatGPT生成大量文章,通过网络传播并引导舆论,会不会被发现和制止?而当你周围充满了这些以假乱真的信息的时候,是否还有动力去创作?相信政府和社会很快就会出台相应的政策和监督措施。
互联网会不会变得更封闭?Copilot、Midjourney都引起过这方面的讨论,AI伦理一个难以回避的问题。Copilot、Midjourney、ChatGPT都是以大量的互联网信息作为语料,专业领域的信息和反馈对于提升模型的精度至关重要。相信大部分的机构和个人是不希望将自己的文章、绘画、代码等被二次加工后打上AI生成的标签的,当原创逐渐成为稀缺资源,未来互联网是否还能保持开放和共享?
技术发展太快?如果New Bing仅仅用来替代你完成作业或是水文章,我不认为这是正确的,学习过程往往比结果更重要。效率也并不代表一切,有时候慢慢的做一件事情可以锻炼人的意志,在挑战中成长,正是人的价值所在。个人感受是,很多情况下技术进步只是解决了工作效率问题,并没有提高人们的幸福感。面对新技术带来的变革,保持包容、合作的态度,不躺不卷做个45度科研人也许是个好的选择。
请关注微信公众号【45度科研人】获取更多精彩内容,欢迎后台留言!