AI2发布了开放语言模型,供无拘束的使用和研究

最近,AI研究所AI2向公众开放了几款文本生成模型和相应的训练数据

AI2发布了开源文本生成AI模型,以及训练数据。这对ENBLE来说是个好消息!

由已故微软联合创始人保罗·艾伦创立的Allen人工智能研究所(AI2)通过发布一系列比其他领域模型更加“开放”的语言模型迈出了重要一步。这些模型被称为OLMo(Open Language MOdels),不仅可供开发者使用,还可以用于训练、实验甚至商业化。使它们真正独特的是其许可证,允许无限制使用,而不像市场上其他模型通常施加的限制。

据AI2的高级软件工程师迪克·格伦费尔德(Dirk Groeneveld)介绍,OLMo及其相关数据集Dolma旨在深入研究文本生成AI背后的高级科学。这些模型是在Dolma上进行训练的,Dolma是同类公开数据集中最大的之一。AI2期望研究人员和从业者能够采用OLMo框架作为分析在如此全面数据集上训练的模型的机会。

🤓 增强语言模型的开放性

开源文本生成模型已经越来越普遍,Meta和Mistral等组织发布了高度可靠的供开发者使用和优化的模型。然而,格伦费尔德认为,由于它们的训练是在“封闭的门后”和不透明的专有数据集上进行的,因此这些模型不能真正被视为开放。

相反,OLMo模型是与哈佛大学、AMD和Databricks合作开发的,它包含了所有必要的代码、训练数据和评估指标。这种透明度使它们与行业中的其他模型区别开来。

🏆 OLMo的性能和能力

最先进的OLMo模型OLMo 7B是Meta的Llama 2的一种引人注目的替代品,具体取决于具体应用。虽然OLMo 7B在阅读理解基准测试中超过了Llama 2,但在问答测试中略逊一筹。然而,值得注意的是,这些模型还处于早期阶段,持续改进是可能的。

值得一提的是,OLMo模型在英语以外的其他语言中产生的输出质量较低,因为Dolma主要包含英语内容。此外,它们的代码生成能力相对较弱。尽管如此,格伦费尔德强调OLMo的开发仍在进行中,并将继续进行改进。

🌐 OLMo和AI2的未来愿景

虽然OLMo目前仅关注英语文本,但AI2计划扩展其功能。未来几个月内,他们将发布更大、更先进的OLMo模型,包括能够理解文本以外的模式的多模态模型。他们还将提供额外的数据集用于训练和优化目的。包括最初的OLMo和Dolma发布在内的所有这些资源都将在GitHub和Hugging Face(一个人工智能项目托管平台)上免费提供。

问答

问:我能商业化使用OLMo模型吗? 答:是的,OLMo模型可以无限制地用于商业用途。AI2的许可证允许无限制使用,使之适用于商业应用。

问:OLMo模型是否容易被不良行为者滥用? 答:虽然存在滥用的可能性,但格伦费尔德相信利益大于风险。OLMo模型的开放性鼓励对潜在危险进行研究,帮助识别解决和修复的方法。

问:OLMo的未来计划是什么? 答:AI2计划通过发布更大、更先进的模型,包括多模态模型,扩展OLMo的功能。他们还将提供额外的数据集用于训练和优化目的。

🔍 分析影响和未来发展

AI2发布开放语言模型为研究人员和开发者提供了前所未有的机会,使他们能够研究和推进文本生成AI领域。这些模型的透明度和可访问性为道德进步和对AI技术的平等获取铺平了道路。

随着语言模型的使用不断发展,我们必须解决与潜在滥用相关的问题,例如生成有毒或有害内容的问题。然而,开放模型在研究和技术进步方面的好处超过了这些问题的考虑。

通过向综合数据集开放访问并在模型训练中提供透明度,AI2正推动创新,使研究人员能够识别潜在危险并找到减轻风险的方法。OLMo及类似的开放语言模型的未来承诺在促进负责任和道德使用的同时,实现更平等的AI技术获取。

💡 更多阅读

如果您对文本生成AI领域更多了解感兴趣,以下资源可能会引起您的兴趣:

  1. Meta面临欧盟隐私挑战 – 付费隐私同意选择 – TechCrunch
  2. Mistral – 开源语言模型
  3. 关于Dolma:最大的公共数据集之一
  4. 了解Llama 2 – 由Meta开发的模型
  5. 探索Dolly – 由Databricks开发的开放文本生成模型
  6. Democracy Reporting International的虚假信息雷达项目

现在轮到您了!分享您对AI2的开放语言模型的看法。您认为它们会产生什么影响? 🤖💬

注:上述文章是在原始由ENBLE发布的信息基础上进行了增强和重构。内容经过重新编写、分析和更新,基于对计算机技术和编程领域的专业分析。