“开源大模型新王者”:不是Meta的Llama 2,来自这家欧洲公司
激石Pepperstone(http://www.paraat.net/)报道:
你见过比Llama 2参数小10倍、性能更好还支持开源的大语言模型吗?
Mistral 7B做到了。
根据媒体报道,Mistral发布的“预告模型”显示,在参数量为Llama 2 70B的十分之一的基础上,Mistral 7B成功在MT Bench上击败了Llama 2。
MT Bench作为一个测试降准,由80个高质量的多轮对话问题组成,旨在测试多轮对话和指令遵循能力。
这意味着大语言模型(LLM)终于在参数尺寸和性能平衡的问题上找到了一个解决方案。据官方介绍,Mistral 7B在所有标准英语和代码基准测试中的性能优于当前可用的高达13B参数的LLM。
今年9月,刚刚成立6个月的法国AI公司Mistral AI正式发布Mistral 7B;上周,作为唯一一家欧洲公司,Mistral AI参加了10月在英国举办的人工智能工程师峰会,与OpenAI、谷歌、Meta等科技巨头同台。
“技术先驱”
专业度让Mistral成为AI投资界的新宠儿。
Mistral的创始人Arthur Mensch在接受媒体采访时表示,尽管作为一家年轻的初创公司,但Mistral对标的是包括谷歌、OpenAI在内的整个AI行业:
“我们一直是这项技术的先驱。”
“我们与所有人竞争。”
Mistral官方这样形容Mistral 7B的成长速度:
“两年内,它从Gopher到Chinchilla,再到Llama 2,以及Mistral 7B。"
其中:Gopher由DeepMind于2021年推出,280B参数量;Chinchilla由DeepMind由于2022年推出,70B参数量;Llama 2由Meta于2023年7月推出,34B参数量。
目前,有消息称a16z考虑向Mistral投资2.5亿美元。据直接了解谈判情况的人士透露,包括General Catalyst和Andreessen Horowitz在内的硅谷重量级企业正在考虑出资4亿欧元,这可能会推升Mistral的估值达到15-20亿欧元。
Lightspeed Venture Partners 的合伙人安托万·莫伊鲁德 (Antoine Moyroud) 主导了Mistral的第一轮融资,他表示:“他们的表现超出了我们的内部预期,”并补充道“对这项业务越来越感到兴奋。”
和硅谷分庭抗礼?
目前,以谷歌、OpenAI为首的硅谷AI公司正处于金字塔顶端,并不断向上谋求发展,这些硅谷公司也是大多数投资者重点关注的对象。
据悉,OpenAI 正在尝试以860亿美元的估值出售员工股票;Anthropic最近收到了谷歌和亚马逊的投资承诺,投资总额可能达到60亿美元。
Mistral的异军突起点亮了欧洲在AI领域的一盏灯。
因为市值超过10亿欧元的公司在欧洲更为稀缺,而此前法国总统马克龙也多次暗示对AI领域的雄心勃勃,希望能够培育欧洲本土的AI企业。
Mistral的优势不止于技术面,Mensch曾表示,相对于规模更大、资金更充足的竞争对手,Mistral在效率上更有优势。
他表示,该公司仅用10人的团队就推出了第一个LLM模型,培训成本不到50万美元,而竞争对手则花费了数千万美元。他补充道:“我们很高兴成为资本效率最高的LLM公司。”
另一个优势在于开源。因Mistral公开发布其AI模型,支持Apache 2.0开源协议,这能够使企业客户更好地控制他们的数据,对其中的使用过程可见性更高,并且能够吸引开发领域的专业人才。
不过,尽管Mistral在6月的种子轮融资中获得了创纪录的1.05亿欧元,但其目前尚未盈利。Mensch表示这种情况将在“年底前”发生改变,他预计将发布一个新平台供客户访问其LLM模型。
Mitral投资方之一的New Wave的合伙人皮亚·德伊里巴内 (Pia d'Iribarne) 表示,建立大型人工智能企业的“基本面已经具备”。