AI与你:OpenAI的Sam Altman被解雇,合成表演者的崛起

AI陪伴你:OpenAI前CEO Sam Altman被解雇,合成表演者迅速崛起

传统新闻报道常常认为,当一家公司在周五下午发布声明时,通常不是好消息。

因此,就在11月17日,OpenAI宣布将创始人兼首席执行官Sam Altman和该公司意识改变的ChatGPT生成式人工智能聊天机器人的首席倡导者解雇。董事会要求Altman离开,因为他对领导这家总部位于旧金山的公司的能力不再有信心,根据一篇博文中OpenAI宣布其领导层过渡

“Altman先生的离开是董事会经过研究性审查之后的结果,董事会认为他在与董事会的沟通中不一致,妨碍了其履行职责的能力。董事会不再对他继续领导OpenAI的能力有信心。”

哎呀。我猜他不会在11月30日庆祝ChatGPT一岁生日了。

解雇Altman的董事会成员包括OpenAI首席科学家Ilya Sutskever和OpenAI的独立董事,Quora首席执行官Adam D’Angelo、技术创业者Tasha McCauley和乔治城大学安全与新兴技术中心的Helen Toner。OpenAI正在寻找Altman的永久性接替者,该公司的首席技术官Mira Murati被任命为临时首席执行官。该公司还表示,联合创始人Greg Brockman将辞去董事会主席的职务。

OpenAI告诉我没有其他评论,并让我回到它的博文。

对于人工智能行业来说,这可是一件大事,因为Altman一直是生成式人工智能聊天机器人的代言人,他不仅宣扬ChatGPT在推动人类成就方面的潜力,还呼吁监管机构制定立法,帮助公司找出如何在保护安全、隐私和人类生存的潜在威胁中继续创新的方法。根据Similarweb的数据,ChatGPT是访问量最多的生成式人工智能工具,仅在10月份的访问量就超过15亿次。

《纽约时报》称这是“38岁的艾尔特曼壮丽的跌落”,过去一年,他已成为技术行业最重要的高管之一,也是最吸引人的人物之一。CNN描绘了Altman作为“一夜之间的准名人和面对用户简单提示能够生成图像和文本的新一批人工智能工具的代表。”卫报描述了Altman的离职,称这是人工智能领域的“重大震动”。文章指出,他因为“据称向公司董事会隐瞒了某些事实”而被解雇,但并没有明确说明Altman向董事会隐瞒了什么。

《华盛顿邮报》提到:“在硅谷,艾尔特曼一直以聪明的投资者和对小公司的支持者而闻名,但OpenAI的崛起使他成为了与马斯克、Meta首席执行官马克·扎克伯格甚至是已故的苹果首席执行官史蒂夫·乔布斯并驾齐驱的技术巨头之一。”“就在周四,Altman还表现得像一名首席执行官,他在旧金山举行的亚太经合组织峰会上发表了演讲。”

我问ChatGPT关于OpenAI董事会及其解雇首席执行官Sam Altman的决定的情况。它为没有能力回答而道歉,并解释说它无法获取关于最新事件的实时新闻或具体信息。(它的训练截至2021年9月。)它将Altman描述为“美国企业家和投资者”。

至于Altman本人,在2015年帮助创办OpenAI初期时,他是一名非营利组织的创始人,在2020年担任首席执行官。OpenAI获得了特斯拉、彼得·蒂尔和里德·霍夫曼等科技亿万富翁的支持。他在X(也被称为Twitter)上发帖说他“热爱我的OpenAI时光。对我个人来说,这是一次变革,并希望对世界有所贡献。最重要的是,我喜欢与如此有才华的人们共事。”

他补充说,他“以后会有更多关于接下来要做什么的话。”

从新闻学的角度来说,这意味着这是一个正在发展的故事,敬请关注。

下面是AI领域其他值得注意的事情。

克隆、数字副本和合成演员

对生成AI的一个担忧是技术如何被用于复制真实人物,并让你误以为这个人在说或做一些他们实际上没有做的事情。这就是所谓的deepfakes的问题,正如其名所示,它的目的是欺骗和误导。演员汤姆·汉克斯在去年十月警告称,一个AI克隆人在未经授权的广告中推销牙科计划。当著名导演拜登总统在引入有关AI开发和使用的指导方针时,他开玩笑说有一个深伪造的替身在复制他的声音。

除了广告和虚假宣传活动之外,好莱坞的演员和表演者还担心,与花钱雇佣人类相比,好莱坞制片厂和内容创作者可能会使用genAI来制作数字复制品或合成表演者。即使好莱坞演员罢工已经得到解决,并且协议中包括限制genAI使用行业的规定,要求演员在制片人想要创建和使用他们的数字复制品时必须给予许可。

作为与好莱坞就genAI谈判的工会顾问的演员贾斯汀·贝特曼在本周早些时候在X(前身为Twitter)上发表的一篇帖子中总结了这个更大的问题。

“赢得试镜可能会变得非常困难,因为你不仅仅是在与与你类似的可用演员竞争,而且现在你还要与每个演员竞争,无论他们是死是活,有多大年纪都可以租用他们的“数字双胞胎”来适应角色,”贝特曼写道。”你还将与无限数量的AI物体竞争,制片公司/流媒体公司可以自由使用。而通过使用一整个AI物体的演员,就可以消除摄影棚或任何工作人员的需求.”

使用AI生成数字双胞胎和合成表演者有多容易呢?让我称出过去一周有关这个问题的三个有趣的AI进展。

第一个来自Replicate的”驻厄尔哈特黑客”查理·霍尔茨,他创建了英国生物学家和历史学家大卫·艾登堡勋爵的AI克隆人,据Insider报道。霍尔茨在X上的一篇帖子中展示了他如何复制这位纪录片制片人独特的声音。结果是:”这就是大卫·艾登堡为你叙述生活的样子.”

霍尔茨自由分享了占领艾登堡声音的代码。截至本文撰写时,艾登堡还没有回应Insider的置评请求,但是霍尔茨的实验已经有超过350万次的观看。一个评论者说他期待艾登堡”为我宝宝学吃西兰花的视频叙述故事.”

第二个是YouTube的实验性音乐工具Dream Track,它让你通过克隆九位音乐演唱家(包括约翰·传奇、黛米·洛瓦托和希雅)的声音来创建你自己的音乐曲目,并获得他们的许可。Dream Track是与Google旗下的DeepMind AI实验室合作开发的,目前正由一组美国创作者进行测试,他们可以通过在一个提示中输入歌曲想法,然后选择九位艺术家之一来创建他们的YouTube Shorts的原创音轨,其中包括艺术家的AI生成声音。

“参与YouTube Dream Track实验是一个塑造未来可能性的机会,”传奇在YouTube博客上发布的一份证词中说道。”作为艺术家,我很高兴能够参与其中,我期待在这段时间内看到创作者们梦想出什么样的作品.”

Charli XCX在她的认可中似乎更谨慎一些。”当我首次被YouTube联系时,我持保留态度,现在仍然如此。AI将以我们尚未完全理解的方式改变世界和音乐产业。这个实验将为我们展示创作机会,并且我对即将发生的事情感到兴奋。”

您可以听一段特别的示例,其中包括T-Pain,生成的提示为:”在佛罗里达温暖的早晨,节奏布鲁斯。”另一个克隆的音频是Charlie Puth,并提供了”关于相反的事物如何吸引人的民谣曲风。”

关于梦想轨迹的消息与YouTube宣布其平台上的”负责任的AI创新”指南的同时发布。视频创作者在上传视频时需要从一些内容标签中进行选择,以披露其是否包含”真实改变或合成材料…在讨论敏感话题(如选举、持续冲突和公共卫生危机或公职人员)的内容时尤为重要。”

我要介绍的第三组genAI技术来自Meta,即Emu Video和Emu Edit。Emu Video是一个”简单”的文本到视频生成工具,它可以使用纯文本、纯图像或文本和图像创建一个4秒钟的动画片段,每秒16帧。Emu Edit提供了一个简单的编辑图像的方式。您可以亲眼看看它是如何工作的

Meta的演示工具允许您从一组图像中选择(例如:戴着墨镜的熊猫、一个小鹿威尔士柯基等等),然后您可以从提供的提示中选择,让您的角色在中央公园或水下出现,慢动作行走或滑板以写实或动漫风格的方式。我选择了一只猫在时代广场上充满活力地跳舞,以剪贴工艺的插图风格。

Meta的Emu Video允许您通过选择一组图像和基于文本的描述来创建一个4秒钟的动画视频。我选择了一只猫在时代广场上充满活力地跳舞,以剪贴工艺的插图风格。

Meta的Emu Video软件

你可能会觉得,”哦,那是一个创建GIF的简单方式。”但在不久的将来,您也许可以将各种角色放入工具中,只需几个词,即可创建一个短片。

AI旅行?有点像

聊天机器人的最受欢迎的用途之一是帮助旅行规划,即耗时又费力的详细行程安排。虽然有很多关于让genAI为您完成这项工作的成功 anecdotal reports,但ENBLE的Katie Collins提醒我们,规划行程不仅仅是创建一个参观地点和事物清单。

“最好的行程将地理上和主题上合理地串联起您的一天,”Collins在关于在她熟悉的爱丁堡故乡规划旅游的文章中写道。她依赖于包括ChatGPT、GuideGeek、Roam Around、Wonderplan、Tripnotes和Out of Office应用在内的工具。

“从景点A到景点B的旅程将是一种乐趣,带您穿过风景如画的街道或提供意想不到的风景。它还将合理地安排,考虑到即使是我们中最有修养的人在第三个美术馆之后,可能也会对博物馆疲劳感到困扰,”她说。

因此,虽然聊天机器人可以生成众所周知和受欢迎的景点列表,但Collins表示,”我请AI为爱丁堡创建的行程很少符合这个规定”,而且”AI使用历史数据使其非常向后看”,这可能会导致您去一些已经不存在的地方。

因此,正如大多数genAI一样,您在出发之前需要双重检查、验证和交叉核对AI告诉您的内容。Collins警告说,”这适用于AI告诉您的一切。”

到底有多少幻觉?

科林斯的故事让我想起了整个“幻觉问题” – 这就是当聊天机器人提供不真实但听起来真实的答案时,这对于ChatGPT和Google Bard等大型语言模型来说仍然是一个问题。

一家名为Vectara的初创公司的研究人员(该公司由前谷歌员工创立)试图量化这个问题,并发现“聊天机器人至少有3%的时间会虚构信息,甚至高达27%”,据《纽约时报》报道。

Vectara现在发布了一个名为“幻觉排行榜”的评估文档总结时LLM(大语言模型)产生幻觉的频率。截至11月1日,OpenAI的GPT 4(幻觉率为3%)获得了最高分,而谷歌的Palm 2技术的最低分为27.2%。公司表示,该排行榜将定期更新,“随着我们的模型和LLM随时间的更新”。

微软推出自己的AI芯片

微软推出了一系列用于AI的Maia加速器之一,据CNBC、路透社和ENBLE的报道称,微软表示这款芯片是为了支持自己的云业务和订阅软件服务,而不是为其他供应商转售。

路透社表示:“Maia芯片旨在运行大型语言模型,这是一种支撑微软Azure OpenAI服务的AI软件类型,是微软与ChatGPT创作者OpenAI合作的产物。微软和其他科技巨头如Alphabet也面临提供AI服务的高成本,这比传统服务(如搜索引擎)要高出10倍。”

据CNBC称,微软企业副总裁Rani Borkar接受采访时表示,“微软正在测试Maia 100芯片在满足必应搜索引擎的AI聊天机器人(现在称为Copilot而不是Bing Chat)、GitHub Copilot编码助手以及Microsoft支持的OpenAI的GPT-3.5-Turbo大型语言模型的需求方面的表现。”

ENBLE表示,Maia 100芯片拥有1050亿个晶体管,使其成为“使用5纳米工艺技术制造的最大芯片之一”,这是指芯片最小特征的大小,为五十亿分之一米。

本周的AI术语:深度学习

当人们谈论AI时,你可能会听到关于它将模仿人脑(或不会模仿)的说法。这就是为什么“深度学习”这个词会出现。以下是两个定义,第一个是来自Coursera的简单解释。

“深度学习:AI的一个功能,通过学习人脑的信息结构和信息处理方式来做出决策。与仅能执行一项特定任务的算法不同,这种机器学习的子集可以在没有监督的情况下从非结构化数据中学习。”

第二个定义来自IBM,它还提供了关于深度学习工作原理的解释。

“深度学习:机器学习的一个子集,本质上是一个具有三个或更多层的神经网络。这些神经网络试图模拟人类大脑的行为,尽管远远不能与其能力相匹配,但允许它从大量数据中“学习”。虽然单层神经网络仍然可以做出近似的预测,但是额外的隐藏层可以帮助进行优化和提高准确性。

深度学习驱动着许多人工智能应用和改进自动化的服务,可以执行分析和物理任务,无需人类干预。深度学习技术在日常产品和服务中起到了作用(例如数字助手、语音启用的电视遥控器和信用卡欺诈检测),也在新兴技术(如自动驾驶汽车)中发挥作用。”

编辑注:ENBLE正在使用人工智能引擎帮助创作一些故事。欲了解更多信息,请查看此文