大模型
-
百川智能和零一万物基础模型登陆中国区域SageMaker JumpStart
亚马逊云科技在中国峰会2024上宣布,由百川智能提供的基础模型Baichuan2-7B即将登陆中国区域SageMaker JumpStart,由零一万物提供的基础模型Yi-1.5 6B/9B/34B正式登陆中国区域SageMaker JumpStart,在为中国企业提供丰富模型选择的同时满足了企业对安全合规、快速扩展、免运维的需求。
-
LlamaIndex:如何为大模型加载一个AI知识库?
大模型,如何用到产业中?
-
数据驱动与 LLM 微调: 打造 E2E 任务型对话 Agent
本文提出了一种利用蒙卡方法和 LLM 生成训练数据集,并将其与 LLaMA Factory 框架相结合,高效微调多种语言模型,构建任务型对话 Agent 的新颖方案。
-
Kimi+扣子(coze) 王炸组合,我想造个GPT-4o
在国产大模型中,Kimi 的表现是很不错的。正好,扣子(coze)平台支持了Kimi大模型。扣子是搭建Agent智能体的平台,今天我们就试试用 Kimi + 扣子,做一个 GPT-4o 效果的智能体。
-
多模态预训练模型在 OPPO 端云场景的落地实践
本文将分享 OPPO 多模态预训练模型在端云场景的落地实践。文章将聚焦于如何在手机端实现云场景大模型的部署,在资源不充分的情况下以更低的成本完成训练和推理的落地。
-
披萨上涂胶水、建议用户吃石头、毒蘑菇……谷歌又被大模型带沟里
近日,有网友在谷歌搜索中查询「芝士和披萨粘不到一块」的解决办法,但 AI 给出的答案离了个大谱,「你还可以把 1/8 杯的无毒胶水加到酱料里,使其更有黏性。」
-
除了RAG,还有这五种方法消除大模型幻觉
最近,ServiceNow通过RAG减少了结构化输出中的幻觉现象,提高了大型语言模型(LLM)的性能,实现了域外泛化,同时最小化了资源使用。
-
大模型烧钱战“卷”出白菜价,李开复、王小川为何拒绝入局?
值得注意的是,在这场硝烟弥漫的肉搏战里,主力多是云巨头,他们所售卖的模型服务往往是与云服务紧密绑定的。而大模型初创公司却顶住了压力,普遍并未有太多动作。
-
一些 Llama3 微调工具以及如何在 Ollama 中运行
本文主要介绍如何使用下面这几个工具进行微调,以及如何在Ollama中安装运行微调后的模型。
-
OpenAI和Google接连两天的大动作,都想让AI助手成“精”
AI助手能否成为AI手机的杀手级应用?
-
字节跳动发布豆包大模型,主力模型比行业价格低99.3%
5月15日,字节跳动豆包大模型在火山引擎原动力大会上正式发布。火山引擎是字节跳动旗下云服务平台,据火山引擎总裁谭待介绍,经过一年时间的迭代和市场验证,豆包大模型正成为国内使用量最大、应用场景最丰富的大模型之一,目前日均处理1200亿Tokens文本,生成3000万张图片。
-
字节跳动豆包大模型发布,火山引擎全栈 AI 服务助力企业智能化转型
5月15日,2024春季火山引擎 FORCE 原动力大会在北京正式举办。会上正式发布了字节跳动豆包大模型家族、火山方舟2.0、AI 应用及 AI 云基础设施等最新产品。
-
谷歌反击:Project Astra正面硬刚GPT-4o、Veo对抗Sora、新版Gemini变革搜索
谷歌在大模型技术与产品方面与 OpenAI 展开了全面竞争的态势。而通过这两天 OpenAI 与谷歌的发布,我们也能发现大模型竞争进入了到了一个新的阶段:多模态、更自然地交互体验成为了大模型技术产品化并为更多人所接受的关键。
-
百万tokens低至1元!大模型越来越卷了
对于开发者和企业来说,模型的使用成本是一个重要考量,大模型降价有利于吸引更多的开发者和企业客户,扩大其生态圈。
-
14 项任务测下来,GPT4V、Gemini等多模态大模型竟都没什么视觉感知能力?
本文提出了BLINK,这是一个新的测试集,包含了重新构想的传统计算机视觉问题,使我们能够更全面评估多模态大模型的视觉感知能力,带你揭开GPT4V、Gemini等大模型的视觉界限秘密。