模型
-
微软颠覆生产力:Copilot推自定义版,AI PC原生支持PyTorch,奥特曼预告新模型
今天 Build 大会的内容主要最新的 Copilot,适用于生成式 AI 的新形态硬件,以及使用新 AI 能力的工具堆栈。
-
ChatGPT语音酷似「寡姐」遭炮轰!奥特曼紧急下架「Sky」
斯嘉丽·约翰逊在一份措辞激烈的声明中表示,在她拒绝为ChatGPT配音的邀请后,OpenAI仍然「厚颜无耻」地模仿了她独特的语气。不过,OpenAI则声称该声音并非有意模仿,但无论如何它都会删除该声音模型「Sky」。
-
李飞飞「空间智能」系列新进展,吴佳俊团队新「BVS」套件评估计算机视觉模型
吴佳俊带领团队发表了后续研究——「BEHAVIOR Vision Suite(BVS)」。论文也获得 CVPR 2024 Highlight。
-
中国大模型头名易主:全球盲测榜单上,Yi-Large与GPT-4o中文并列第一
由开放研究组织 LMSYS Org (Large Model Systems Organization)发布的 Chatbot Arena 已经成为 OpenAI、Anthropic、Google、Meta 等国际大厂 “龙争虎斗” 的当红擂台,以最开放与科学的评测方法,在大模型进入第二年之际开放群众投票。
-
替代MLP的KAN,被开源项目扩展到卷积了
KAN 与 MLP 一样具有强大的数学基础,MLP 基于通用逼近定理,而 KAN 基于 Kolmogorov-Arnold 表示定理。
-
众包新玩法!LLM竞技场诞生基准测试,严格分离学渣学霸
最公平的大模型基准测试诞生了!来自LLM竞技场,最接近人类偏好,数据新鲜、速度快、成本低,严格分离学渣和学霸。
-
150B token从头训练,普林斯顿Meta发布完全可微MoE架构Lory
前几天,普林斯顿大学联合Meta在arXiv上发表了他们最新的研究成果——Lory模型,论文提出构建完全可微的MoE模型,是一种预训练自回归语言模型的新方法。
-
首个GPU高级语言,大规模并行就像写Python,已获8500 Star
上周末,一种名为 Bend 的编程语言在开源社区引发了热烈的讨论,GitHub 的 Star 量已经超过了 8500。
-
Karpathy称赞,从零实现LLaMa3项目爆火,半天1.5k star
十几个小时前,有位名为「Nishant Aklecha」的开发者发布了一个从零开始实现 llama3 的存储库,包括跨多个头的注意力矩阵乘法、位置编码和每个层在内都有非常详细的解释。
-
我们一起聊聊AI模型组合指南
虽然模型组合的好处很明显,从增强的性能到处理多种数据类型的能力,但重要的是要认识到它带来的复杂性,尤其是与生产部署相关的复杂性。
-
Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA
GPT-4o发布不到一周,首个敢于挑战王者的新模型诞生!最近,Meta团队发布了「混合模态」Chameleon,可以在单一神经网络无缝处理文本和图像。10万亿token训练的34B参数模型性能接近GPT-4V,刷新SOTA。
-
GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4
OpenAI半小时的发布会让很多人第一反应是直呼「失望」,但随着官网放出更多demo以及更多网友开始试用,大家才发现GPT-4o真的不可小觑,不仅在各种基准测试中稳拿第一,而且有很多发布会从未提及的惊艳功能。
-
谷歌Gemini 1.5技术报告:轻松证明奥数题,Flash版比GPT-4 Turbo快5倍
谷歌表示,Gemini 1.5 相比 Claude 3.0 和 GPT-4 Turbo 实现了代际提升。
-
开源模型穷途末路?Stability AI欠下1亿美元,四处找钱
从去年开始,Stability AI就传出人才出走、面临诉讼等负面新闻。最新版Stable Diffusion 3今年刚刚发布,效果惊艳、引爆全网,但都没能力挽狂澜,救回这头独角兽。有消息称,高层已决定将公司在秋季售出,Stability AI的前途风雨飘摇。
-
HuggingFace教你怎样做出SOTA视觉模型
从收集阶段开始,就应注意要选择多种类型的数据,如Idefics2就使用的数据就包括三类——图文对齐的文档(如网页)、图像-文本对(如图片标题),以及带OCR标注的PDF文档。