虽然OpenAI的ChatGPT已经成为一种全球现象,并且是有史以来增长最快的消费产品之一,但谷歌的Bard却在某种程度上是事后才想到的。聊天机器人稳步获得了新功能,包括访问其他谷歌产品的数据,但它的答案和信息似乎很少能与ChatGPT和其他使用GPT-3和GPT-4的机器人相媲美。
不过,Bard的案例可能变得更加引人注目:截至今天,对于170个国家的英语用户来说,Bard现在由谷歌的新Gemini模型提供支持,谷歌表示,该模型在许多方面与OpenAI的技术相匹配,甚至超过了OpenAI。(谷歌表示,“在不久的将来”,Gemini将支持更多的语言和国家。)
巴德现在正在运行Gemini Pro,这是Gemini系列的中间层。Ultra是最大最慢的,但功能最强大;Nano小而快,用于设备上的任务;Pro则处于中间位置。这意味着它是这个模型的金发女孩版本,真的:快速高效,同时仍然尽可能地强大。
Pro是指双子座的金发女孩版本:快速和高效,同时仍然尽可能地有能力
在谷歌负责巴德和助手的萧茜茜(Sissie Hsiao)在新闻发布会上表示,双子座代表了巴德“迄今为止最大、最好的升级”。对于巴德已经做过的所有事情来说,这应该是一个显著的进步:总结、头脑风暴、写作等等。谷歌首席执行官桑达尔?皮查伊(Sundar Pichai)告诉我,在他的测试中,他发现iphone 7并没有什么特别的新功能,只是整体上有所改进。他说:“我认为人们只会发现产品变得更好了。”“它能更好地理解他们的意图,回答得更好。它更真实,质量更高。如果你想写代码,那就更好了!”
目前,巴德还只是一个聊天机器人:你输入,它就会回复。但即将推出的新版《巴德》可能会有更多内容。明年,谷歌计划推出“Bard Advanced”的预览版,由Gemini Ultra提供支持,这是谷歌新的大型语言模型中功能最强大的版本。Gemini Ultra也是该模型的多模态版本,这意味着除了文本之外,它还可以接受和创建图像、音频和视频。
非文字互动是双子座的亮点
谷歌DeepMind的负责人杰米斯·哈萨比斯(Demis Hassabis)说,非文本交互是双子座的真正亮点。他说:“我们从一开始就把它打造成了一个多模式的平台。”“这是它拥有的新功能之一……它可以跨模式进行无缝集成和推理。”谷歌的演示包括youtube用户马克·罗伯(Mark Rober)使用巴德制作完美的纸飞机——包括拍摄他的设计以获得人工智能提供的反馈——以及父母上传孩子的家庭作业照片,以帮助找出他们的数学错误。
不过,目前这些都只是演示和宣传视频。皮查伊说,他认为这次发射既是巴德的一个重要时刻,也是双子座时代的开始。但如果谷歌的基准测试是正确的,新模式可能已经使巴德成为一个和ChatGPT一样好的聊天机器人。这已经是一个相当令人印象深刻的壮举了。
有话要说...