模型
-
速度秒掉GPT-4o、22B击败Llama 3 70B,Mistral AI开放首个代码模型
作为一个专为代码生成任务设计的开放式生成 AI 模型,Codestral 通过共享指令和补全 API 端点帮助开发人员编写并与代码交互。Codestral 精通代码和英语,因而可为软件开发人员设计高级 AI 应用。
-
比PID更丝滑的控制算法&卡内基梅隆大学
MPC控制算法的核心在于其预测模型,这个模型可以根据系统的当前状态信息预测未来的系统状态。
-
奥特曼挂帅新团队,OpenAI新一代大模型开训,前任高管却「投敌」了
自 OpenAI 于 2022 年底推出 ChatGPT 以来,人工智能安全在整个科技领域迅速受到重视,并引发了生成式人工智能产品和投资的热潮。
-
和GPT-4这些大模型玩狼人杀,人类因太蠢被票死,真·反向图灵测试
最近,一位昵称「Tore Knabe」的网友在 X 平台发布的一段视频引发了人们的讨论。
-
GPT-5倒计时!奥特曼踢走Ilya得逞,宫斗惊人内幕再曝光
解散Ilya的超级对齐团队之后,奥特曼再造了一个新的「安全委员会」。OpenAI称正训练离AGI更近一步的下一代前沿模型,不过在这90天评估期间,怕是看不到新模型发布了。
-
Yolov10:详解、部署、应用一站式齐全!
在这项工作中,目标是从后处理和模型架构两个方面进一步提高YOLO的性能效率边界。为此,首先提出了YOLOs无NMS训练的一致双重分配,它同时带来了有竞争力的性能和低推理延迟。
-
清华接手,YOLOv10问世:性能大幅提升,登上GitHub热榜
相同性能情况下,延迟减少 46%,参数减少 25%。
-
OpenAI联创Greg最新采访:为什么OpenAI最先做出GPT-4?
为什么是OpenAI首先开发出像GPT-4这样强大的模型?联合创始人Greg在接受采访时透露,团队中不仅仅有学术背景的研究型人才,同时还有优秀的工程人才,这使得他们能够从不同的角度解决问题,更有效地推动项目进步。
-
不影响输出质量还能追踪溯源,「大模型无偏水印」入选ICLR 2024 Spotlight
无偏水印方法为LLM水印技术提供了一种新的思路。通过新颖的采样策略,该方法在保证生成文本质量的同时,实现了可靠的水印嵌入和检测。这为解决LLM生成内容的滥用问题提供了一种有效的解决方案。
-
适应多形态多任务,最强开源机器人学习系统「八爪鱼」诞生
一位优秀的相声演员需要吹拉弹唱样样在行,类似地,一个优秀的机器人模型也应能适应多样化的机器人形态和不同的任务,但目前大多数机器人模型都只能控制一种形态的机器人执行一类任务。现在 Octo(八爪鱼)来了!
-
智慧建筑:基于YOLOv7的建筑外墙缺陷检测
数据扩充是对原始数据执行各种转换的常用技术。它被广泛应用于深度学习领域,以系统地生成更多的训练数据。
-
离大模型落地应用最近的工程化技术(RAG)
RAG技术的应用场景非常广泛,通过召回相关的准确信息来缓解大模型的幻觉问题,有效地弥补了大语言模型在处理实时信息和大规模知识库方面的不足,同时结合了大语言模型的强大的语言理解和生成能力,显著提升了生成内容的质量和实用性。
-
芝大论文证明GPT-4选股准确率高达60%,人类股票分析师要下岗?AI大牛质疑数据污染
GPT-4在为人类选股时,表现竟然超越了大部分人类分析师,和针对金融训练的专业模型?在没有任何上下文的情况下,它们直接就成功分析了财务报表,这一发现让许多业内大咖震惊了。然而好景不长,有AI大牛指出研究中的bug:之所以会这样,很可能是训练数据被污染了。
-
马斯克烧几十亿美元造最大超算中心,10万块H100训练Grok追赶GPT-4o
最近,许久没有新动向的马斯克放出了大消息——他旗下的人工智能初创公司xAI将投入巨资建造一个超算中心,以保证Grok 2及之后版本的训练。这个「超级计算工厂」预计于2025年秋季建成,规模将达到目前最大GPU集群的四倍。
-
CoT提出者Jason Wei:大模型评估基准的「七宗罪」
Jason Wei 是思维链提出者,并和 Yi Tay、Jeff Dean 等人合著了关于大模型涌现能力的论文。目前他正在 OpenAI 进行工作。