-
【AI快讯分析】iPhone搭载微型动力引擎:Google Gemma 2迷你版模型亮相,性能超越GPT-3.5
【原文大意】来源:网上搜集谷歌 DeepMind 最近发布了 Gemma 2 2B 模型,这是一个从更大的 Gemma 2 27B 模型中蒸馏出来的小模型,尽管参数只有 2.6B,但在 LMSYS 竞技场上超越了 GPT-3.5 和 Mixtral 8x7B。在 MMLU 和 MBPP 基准测试中,Gemma 2 2B 分别取得了 56.1 和 36.6 的优异成绩,性能比前代模型 Gemma 1 2B 提升了 1...
-
【快讯分析】开源共享:苹果推出 DCLM-7B 微型模型,权重、代码与数据集全面公开
【原文】来源:网上搜集OpenAI 上线小模型 GPT-4o-mini,小模型赛道正式开卷。近期加入这一赛道的还有苹果。最近,苹果公司作为 DataComp-LM(DCLM)项目的研究机构之一,在 Hugging Face 上发布了 DCLM-7B 开源模型。该模型性能已经超越了 Mistral-7B,并且正在逼近其他领先的开源模型,包括 Llama 3 和 Gemma。【分析结果...
-
【快讯分析】英伟达携手Mistral AI震撼亮相!120亿微型模型霸主傲视群雄,轻松超越Llama 3,单卡4090即可驾驭
【原文大意】来源:网上搜集文章主要介绍了Mistral AI与英伟达合作发布的12B参数小模型Mistral NeMo,该模型在性能上超越了Gemma 2 9B和Llama 3 8B。Mistral NeMo支持128K上下文,能够在多项基准测试中表现出色,特别是在多轮对话、数学、常识推理、世界知识和编码等方面。该模型由Mistral AI的专业知识和英伟达的硬件及软件...
-
【快讯分析】阿尔特曼深夜掀起市场风暴:OpenAI推出全新小尺寸模型GPT-4o mini,GPT-3.5正式告别舞台
【原文大意】来源:网上搜集OpenAI 最近发布了 GPT-4o mini,这是一个更小、性能更强且成本更低的新模型。GPT-4o mini 的推出标志着 OpenAI 进军小模型市场,旨在降低 AI 技术的成本,使更多人能够使用和开发 AI 应用。该模型在多个基准测试中表现优异,尤其是在性价比方面,成为市场上的佼佼者。GPT-4o mini 支持多种任务,...
-
【快讯分析】OpenAI 推出模型规模竞争研究,旨在提升模型表达的清晰度
【原文】来源:网上搜集OpenAI的“超级对齐”团队在其解散前发布了最后一篇论文,展示了一种通过大模型与小模型相互博弈的方法来提升AI输出的可读性和准确性。这种方法模仿了多伦多大学学者与2021年提出的“证明者-验证者”(Prover-Verifier)博弈,训练大模型生成易于理解的内容,同时小模型提高其判断力。研究结果表明,...