AI 模型
-
Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动
最近,许多机构在训练 SOTA 生成式 AI 模型时报告了训练过程中的不稳定情况,它们通常以损失尖峰的形式出现,比如谷歌的 PaLM 模型训练过程中出现了多达 20 次的损失尖峰。
-
OpenAI发布Model Spec,揭示其期望AI如何行动
通过明确定义 AI 模型应如何行为的模型规范,并持续寻求全球社区的输入,OpenAI 旨在培养一个环境,在这个环境中 AI 可以作为社会中的积极力量蓬勃发展 —— 即使在面临诉讼和因未经明确同意而训练艺术家作品的批评时也是如此。
-
硬控设计人一分钟,加持大模型的Adobe,PS起来更香了
Adobe 表示,Firefly Image 3 提供了前所未有的逼真质量,具有更好的光照、定位和对细节的关注。Firefly Image 3 比之前的 Firefly 模型更能理解长的描述性文本提示(prompt),并且可以在其生成的图像中生成更清晰的文本。
-
OpenAI 成立“防备”预警团队:董事会有权阻止新 AI 模型发布
据悉,防备团队每月将向一个新的内部安全咨询小组发送报告,该小组随后将对其进行分析,并向 OpenAI 首席执行官萨姆・阿尔特曼和董事会提交建议。阿尔特曼和公司高层可以根据这些报告决定是否发布新的 AI 系统,但董事会有权撤销这一决定。
-
科学家:大型 AI 模型已可自动生成小型 AI 工具
大型 AI 模型现在已经强大到可以完全自动地创建新的小型 AI 工具,无需任何人类干预。来自麻省理工学院、加州大学多个校区和 AI 科技公司 Aizip 的科学家团队表示,他们已经能够让大型人工智能模型(如 ChatGPT 运行的模型)基本上实现自我复制。
-
可令 AI 模型计算复杂离散数学问题,谷歌 DeepMind 公布“FunSearch”训练法
谷歌 DeepMind 日前公布了一种名为“FunSearch”的模型训练法,号称能够计算包含“上限级问题”、“装箱问题”在内的一系列“涉及数学、计算机科学领域的复杂问题”。
-
亚马逊推出 Titan 系列 AI 模型:可生成图片及文本、号称兼顾价格和性能
亚马逊昨天在 re: Invent 大会中,公布了三款“Titan”系列生成式 AI 模型,其中包含亚马逊旗下首个图像生成模型“Titan Image Generator”、文字生成模型“Amazon Titan Text Express”及“Titan Text Lite”。
-
微软推出 XOT 方法,提升语言模型推理能力
微软近日推出了名为“Everything of Thought”(XOT)的方法,灵感来自谷歌 DeepMind 的 AlphaZero,利用紧凑的神经网络,来增强 AI 模型推理能力。
-
TPC 联盟成立:目标万亿以上参数 AI 模型,推进科学发现
TPC 联盟由来自全球实验室、科研机构、学术界和工业界的科学家组成,目标是共同推进用于科学发现的 AI 模型,特别关注一万亿或更多参数的巨型模型。
-
AI 模型的开源定义需要改变
2023 年,我们以人工智能(AI)崭露头角开始了新的一年,同时也见证了众多公司全力以赴投身于 AI。
-
可令 AI 模型“输入狗生成猫”,黑客展示为训练数据集“下毒”的 Nightshade 工具
日前有黑客展示了一款名为 Nightshade 的工具,该工具可在不破坏观感的情况下轻微修改图片,若有 AI 模型在训练时使用了这些被“下毒”的图片,模型生图结果便会被毁坏。
-
可令 AI 模型“输入狗生成猫”,黑客展示为训练数据集“下毒”的 Nightshade 工具
日前有黑客展示了一款名为 Nightshade 的工具,该工具可在不破坏观感的情况下轻微修改图片,若有 AI 模型在训练时使用了这些被“下毒”的图片,模型生图结果便会被毁坏。
-
国内首个风电机功率曲线 AI 模型上线,填补行业空白
据国家能源之声官方公众号报道,龙源电力工程技术公司日前上线国内首个风电机组功率曲线图像识别 AI 模型,官方表示,“其率先实现风电机组功率曲线特性分析筛查的自动化和智能化,填补了行业空白”。
-
9 月 30 日生效,微软更新 AI 服务条款:不得用于反向工程等
微软强调官方并不会保留用户和必应聊天的对话,也不会利用这些聊天数据,用于训练 Bing Enterprise Chat 的 AI 模型。
-
微软推出人工智能模型 CoDi,可互动和生成多模态内容
微软设计 CoDi 的目标,旨在解决传统单一模态 AI 模型的局限性。以同步视频和音频为例,独立生成的信息流拼接在一起时可能存在不一致和对齐的问题。