大模型
-
撞上数据墙?OpenAI模型提升速度放缓 着手调整开发策略
①新模型Orion性能提升幅度显著缩小。这意味着,随着高质量新数据减少,AI模型改进速度或将放缓。
②OpenAI成立了一个团队,研究能让AI模型保持改进的新方法。
③公司安全系统团队负责人翁荔刚刚宣布,将离开已经工作了近7年的OpenAI。 -
谷歌云与沙特PIF合建全球AI中心 增强Gemini大模型阿拉伯语能力
①沙特公共投资基金(PIF)和谷歌云宣布建立战略合作伙伴关系,以创建一个新的全球人工智能中心;
②这一合作支持了沙特实现信息和通信技术(ICT)行业增长50%的国家目标;
③双方还将探索增强谷歌大模型Gemini的阿拉伯语能力。 -
昆仑万维2024年前三季度研发费用提升84.5%至11.4亿,加速AI大模型向多元化场景渗透
第三季度,昆仑万维多款AI产品在全球范围内成功落地,并赢得市场青睐。
-
商汤组织架构调整 聚焦“大装置-大模型-应用”
①对于组织架构调整和裁员的消息,商汤科技回应称:推进战略转型,聚焦“大装置-大模型-应用” 重点业务和战略增长领域,并进行相应的组织和人才结构优化和调整。
②徐立表示,围绕战略和核心资源,将构建更加集中和高效的组织架构,推动资源的集中和集约化投入,加快组织和管理的年轻化进程。 -
AI智算中心现状五问|行业调研
①供给端紧缺状况缓解,各类计算卡价格现已贴近销售商成本线。
②智算需求持续增长,但需求方趋于理性,供需不完全匹配。
③全国百余个智算中心中,算力闲置并非普遍现象。
④从业者预计,部分智算中心三四年左右能够“回本”。
⑤首个高质量算力评估体系发布,业内希望用更小算力产生更多的智能。 -
大模型一体机成趋势!模型微调重要性凸显 浪潮信息最新入局|行业动态
①一体机成为大模型商业化探索过程中一大热门趋势,大模型厂商、ICT服务商及ISV服务商均已布局。
②目前公开招投标的AI项目中,硬件和服务占总金额90%以上,浪潮信息一体机将硬件与面向大模型的解决方案做了整体打包。
③业内关注模型微调、推理,微调重要性凸显。 -
“卡脖子”有解了?中国超算能否成为“全村的希望”?专家:不必学马斯克猛堆10万块GPU,大模型专用超算或将「破壁」算力瓶颈
英伟达新推出的最强芯片GB200就是这个思路,该芯片由两个B200 Blackwell GPU和一个基于Arm的Grace CPU组成。通过NVIDIA先进的 NVLink-C2C互连技术,CPU和GPU之间可以紧密协同,以减少数据在两者之间的传输时间,提高处理速度。
-
GPT-4o与SQL:大模型改变自身架构的能力有多强?
我毫不怀疑,随着时间的推移,大型语言模型与专业化的某种结合将逐步解决这些工程问题,但目前我们应该为GPT-4o能够高效地生成和修改合理架构的能力而感到胜利。
-
大模型“分区”部署在云和边缘更合适?
将生成式AI的大型语言模型(LLMs)分区部署在边缘和中心/云基础设施上,是AI部署的下一个前沿领域。这种混合方法提高了性能和响应速度,并优化了资源使用和安全性。然而,大多数企业甚至技术提供商都害怕这种架构,认为它太复杂、太昂贵,并且构建和部署速度太慢。
-
让大模型发挥更大作用,离不开知识库这个关键要素
从自然语言处理(NLP)、内容生成到图像识别,大模型在各个领域都展现出了惊人的能力。然而大模型在处理特定领域问题时,可能会因缺乏必要的背景知识,导致输出结果不够准确或不够相关。
-
AnythingLLM:零成本的私人ChatGPT,支持几乎所有主流大模型
开源、高效、可定制的私人ChatGPT。
-
工业知识图谱进阶实战
本文将分享知识图谱对工业界的重要性以及目前主流的一些图谱产品形态,并通过真实案例介绍知识图谱的在工业界的应用。
-
国产大模型全阵容,中文大模型竞技场推出!
近日,上海人工智能实验室联合魔搭社区推出中国大语言模型评测竞技场Compass Arena,首度集齐国内主流大模型全阵容,阿里通义千问、百度文心一言、腾讯混元、讯飞星火、字节跳动豆包、智谱AI、百川智能、零一万物、月之暗面、Minimax、深度求索、书生·浦语等20款国产大模型出战,角逐中国大模型“最强王者”。
-
大模型风起云涌,向量数据库终有“用武之地”?
每逢淘金热,最后的赢家都是卖铲人,而非淘金者。在近两年的大模型风口下,向量数据库就成了这把铲子。
-
大模型App腾讯元宝上线!混元再升级,打造可随身携带的全能AI助理
与此同时,腾讯元器全量开放,可一键分发智能体至腾讯元宝App