模型
-
GPT-4o:实现跨越文本与视觉的智能交互
本文通过具体的应用实例和对比测试,展示了GPT-4o在问答系统和图像理解方面的实际应用,并提供了详细的集成方法和代码实现。无论是个人用户还是企业开发者,都能通过GPT-4o体验到更智能、更自然的人机交互。
-
又被 OpenAI 截胡,Google推出开源视觉语言模型:PaliGemma
总结来说,PaliGemma 是一个强大的视觉语言模型,适用于多种需要视觉和语言结合的应用场景,特别是在图像处理和自然语言处理领域。
-
WOT大会日程上线:我们找来数十位大模型实践企业现身说法
除大模型相关话题外,本届大会还设立了研发效能提升、架构演进、大数据、技术领导力、大前端等多个技术人持续关注的话题方向,邀请京东、51Talk、作业帮、方正证券、阅文集团等企业专家带来精彩分享。
-
李飞飞揭秘创业方向“空间智能”:视觉化为洞察,看见成为理解,理解导致行动
李飞飞最新15分钟TED演讲完整公开,从数亿年前生命进化的起源开始,到人类如何不满足于自然赋予而发展人工智能,到下一步如何构建空间智能。
-
OpenAI 首次推出 GPT-4o“全能”模型,干翻所有语音助手
OpenAI 的技术总监 Mira Murati 表示,虽然 GPT-4o 仍然保持着 GPT-4 的智能水平,但它在多种媒介和模式上进行了显著的提升。
-
首个中文原生DiT架构!腾讯混元文生图大模型全面开源,免费商用
这是业内首个中文原生的 DiT 架构文生图开源模型,支持中英文双语输入及理解,参数量 15 亿。
-
MIT最新!多模态LLM真的无所不能吗?大模型能解决一切难题吗?
本文介绍了一个专门设计的模拟器DR I V ESI M,用于生成各种驾驶场景,为评估MLLMs在驾驶领域提供了平台。
-
无需OpenAI数据,跻身代码大模型榜单!UIUC发布StarCoder-15B-Instruct
通过StarCoder2-15B生成数千个指令-响应对,直接对StarCoder-15B基座模型进行微调,无需依赖昂贵的人工标注数据,也无需从GPT4等商业大模型中获取数据,StarCoder2-15B-Instruct成功挤进HumanEval榜单。
-
思维链不存在了?纽约大学最新研究:推理步骤可省略
思维链技术,可能要被推翻了!来自纽约大学的最新研究表明:大模型并没有利用思维链的推理能力,它只是偷偷加了计算!
-
微软让MoE长出多个头,大幅提升专家激活率
MH-MoE 能优化几乎所有专家,实现起来非常简单。
-
GPT-4调教指令揭秘,OpenAI又「Open」了一回!网友在线追问GPT-5
GPT-4越来越懂事了,这背后有着非常巧妙的「调教」策略。OpenAI最新发布的「模型规范」,给LLM列出了条条框框,即正确的行为方式。没想到,评论区一大片网友催更GPT-5。
-
GPT-4o深夜炸场!AI实时视频通话丝滑如人类,Plus功能免费可用,奥特曼:《她》来了
OpenAI最新旗舰大模型GPT-4o,不仅免费可用,能力更是横跨听图片、看图片、说图片,丝滑流畅毫无延迟,就像在打一个视频电话。
-
万字长文总结提示词技巧!新加坡首届GPT-4提示工程大赛冠军最新分享
提示工程已经成为了热门话题,无论是CO-STAR框架构建提示词,使用分隔符将提示词分段,使用LLM护栏创建系统提示,还是仅使用LLM(无需插件或代码)分析数据集,用户都将拥有全新的使用体验。
-
美国教授用2岁女儿训AI模型登Science!人类幼崽头戴相机训练全新AI
为训练AI模型,纽约州立大学的一名教授Brenden Lake,竟让自己不到2岁女儿头戴相机收集数据!要知道,Meta训Llama 3直接用了15万亿个token,如果Lake真能让AI模型学习人类幼崽,从有限的输入中学习,那LLM的全球数据荒岂不是解决了?
-
只需百行代码,让H100提速30%,斯坦福开源全新AI加速框架
文章用大量篇幅讨论了如何让 GPU 更快的运行,并发布了一个库 ThunderKittens,用户可以很容易地在 CUDA 上编写快速的深度学习内核。