人工智能
-
研究人员使用机器学习优化高功率激光实验
高强度和高重复的激光器能快速连续每秒发射多次强大的光。商业聚变能源工厂和先进的紧凑型辐射源都依赖这种激光系统。然而,人类的反应时间不足以管理这种速射系统,应用面临挑战。
-
一文读懂如何基于Ollama在本地运行LLM
“Mixtral有46.7B的总参数,但每个令牌只使用12.9B参数。因此,它以与12.9B型号相同的速度和成本处理输入并生成输出。”
-
LeCun新作:分层世界模型,数据驱动的人型机器人控制
在复杂的物理世界中,人型机器人的全身控制一直是个难题,现有的强化学习做出的效果有时会比较抽象。近日,LeCun参与的一项工作给出了基于数据驱动的全新解决方案。
-
多模态模型学会打扑克:表现超越GPT-4v,全新强化学习框架是关键
智能体在执行玩21点的任务时,系统直接要求多模态模型根据目前的状态,在输出思维链之后选择“停牌” (stand)或者“拿牌”(hit),然后直接将对应的动作输入到环境中,得到奖励函数值以及下一个状态。
-
3B模型新SOTA!开源AI让日常调用不同大模型更简单
两位斯坦福校友创办的NEXA AI,提出了一种新的方法:采用functional token整合了多个开源模型,每个模型都针对特定任务进行了优化。
-
Karpathy点赞,这份报告教你如何用 LLaMa 3创建高质量网络数据集
事实证明,LLM 从教育内容中学习会更好更快。部分原因是普通的互联网爬取文章的价值不是很高,并且会分散训练的注意力,包含太多不相关的信息。
-
Mamba-2新架构出世一统江湖!普林斯顿CMU华人再出神作,性能狂飙8倍
在开源社区引起「海啸」的Mamba架构,再次卷土重来!这次,Mamba-2顺利拿下ICML。通过统一SSM和注意力机制,Transformer和SSM直接成了「一家亲」,Mamba-2这是要一统江湖了?
-
套壳丑闻让斯坦福AI Lab主任怒了!抄袭团队2人甩锅1人失踪、前科经历被扒,网友:重新认识中国开源模型
致歉推文,由Siddharth Sharma(悉达多)和Aksh Garg(阿克什)发出。
-
Ilya离开后,8位OpenAI新安全与保密委员会领军人物,你认识几位?
OpenAI董事会成员妮科尔·塞利格曼(Nicole Seligman)是一位企业和公民领袖以及律师。作为索尼公司的前执行副总裁和总法律顾问,塞利格曼目前担任三家上市公司的董事会成员,分别是派拉蒙全球公司(Paramount Global)、MeiraGTx Holdings PLC和Intuitive Machines Inc。
-
AI训练数据的版权保护:公地的悲剧还是合作的繁荣?
就算是 OpenAI 在舆论场也无法逃过版权保护的呼声。近日,普林斯顿大学、哥伦比亚大学、哈佛大学和宾夕法尼亚大学共同推出了一项关于生成式AI版权保护的新方案,题为《An Economic Solution to Copyright Challenges of Generative AI》。
-
被作者删库的Llama 3-V原文再现!效果匹敌GPT4-V,训练费用暴降,区区不到500 美元,尺寸小100 倍,如何做到的
Llama3 风靡全球,在几乎所有基准测试中都优于 GPT3.5,在多个基准测试中也优于 GPT4。随后,GPT4o 应运而生,凭借其多模态精细度夺回王位。
-
苏妈杀疯了:移动端最强NPU算力达50TOPS,最强AI芯片挑战英伟达
英伟达现场拿出了量产版 Blackwell 芯片,还公布了未来三年的产品路线,包括下一代 Rubin AI 平台。
-
一文读懂如何基于 Ollama 在本地运行 LLM
作为一个功能强大且使用便捷的工具套件,Ollama不仅为用户提供了精心策源的优质模型备选,更允许直接引入自有的自定义模型,确保了最大程度的灵活性和定制空间。
-
零基础也能搞懂卷积神经网络原理!超详细!
相信对AI兴趣浓厚的小伙伴们,一定对卷积神经网络并不陌生, 今天我们将从零开始走进卷积神经网络的世界!
-
AI预测极端天气提速5000倍!微软发布Aurora,借AI之眼预测全球风暴
微软发布首个大规模大气基础模型Aurora,可被用于预测和减轻极端天气影响,模型拥有超高的准确率和效率,与如今数值预报系统界的SOTA相比,它的计算速度提高了约5000倍。