模型
-
什么是OSI模型第四层?
第 4 层的数据中心安全对于保护有价值的信息免遭未经授权的访问、拦截和篡改至关重要。了解第 4 层在数据中心安全中的作用、实施最佳实践以及从现实世界的例子中学习有助于组织增强其安全措施并保护其数据资产。
-
OpenAI正式推出AI视频生成模型Sora 会员无需额外付费
①Sora向ChatGPT付费用户开放,Sora Turbo可生成最长达20秒视频及多种变体;
②Sora发布为OpenAI为期12天产品直播活动一部分,该工具不仅可以通过文本提示生成视频,还能够基于静态图片和已有视频创建新的内容。 -
GPT-4o与SQL:大模型改变自身架构的能力有多强?
我毫不怀疑,随着时间的推移,大型语言模型与专业化的某种结合将逐步解决这些工程问题,但目前我们应该为GPT-4o能够高效地生成和修改合理架构的能力而感到胜利。
-
黎曼猜想显著突破!陶哲轩强推MIT、牛津新论文,37岁菲尔兹奖得主参与
最近,被称为千禧年七大难题之一的黎曼猜想迎来了新突破。
-
大模型到底有没有智能?一篇文章给你讲明明白白
在 LLM 的世界里,每个 token 都有一个独一无二的数字身份证。而 Tokenizer,就是文本和 token 之间的 “翻译官”,将人类的语言转化为 LLM 能理解的编码,也将 LLM 的思维解码为人类的文字。
-
把整个地球装进神经网络,北航团队推出全球遥感图像生成模型
MetaEarth拥有6亿参数,可实现多种分辨率、无界且覆盖全球任意地理位置的遥感图像生成。
-
英特尔牙膏挤爆:功耗降40%、AI算力120TOPS,你的下一代笔记本没有内存条了
英特尔称,这将使数据系统传输功耗降低约40%,笔记本续航有保障了。
-
腾讯混元、北大发现Scaling law「浪涌现象」,解决学习率调参难题
腾讯混元联合北京大学基于现有科研基础和实际业务需求,在进行了大量理论分析和实验验证后发布了关于 Batch size 和 Learning rate 放缩关系的调参指南
-
北京9岁小学生,已经用AI出书了!罗永浩围观:有事找不到我找AI
在模型方面,智谱AI主打的就是“发布即上线”,包括刚才新发布的GLM-4-9B等,全部都已经集成到了平台当中。并且GLM-4全系列都是无需代码,三步完成微调的那种(支持LoRA微调和全参微调),操作上也是相当的简单。
-
Thoughtworks肖然:大模型走向大众,需要新的应用开发逻辑
肖然认为,这一代智能技术产品的开发模式已然与之前不同。因为过去的产品,讲究洞察人性与需求,而现在产品的矛盾点已经不再是需求场景怎么定义的问题,而是“确定了一个场景,大致明确要做的方向,不停地实验,迭代往前走”的“创新实验”的方法逻辑。
-
首次证实白盒Transformer可扩展性!马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升
CRATE-α是一种新型Transformer架构变体,通过设计改进提升了模型的可扩展性、性能和可解释性,CRATE-α-Base在ImageNet分类任务上的性能显著超过了之前最好的CRATE-B模型,其性能会随着模型和数据集规模扩大而继续提升。
-
一夜暴富50亿,老黄新晋「流量明星」!英伟达市值破3万亿,超越苹果成全球第二
英伟达,已成世界上第一家市值突破3万亿美元的芯片公司!老黄的个人财富,也随之一夜暴增50亿美元!英伟达超越苹果,意味着硅谷的一大转变。华尔街也在此刻做出预言:「英伟达也将超越微软,这大概率已成定局。」
-
清北爸爸辅导数学崩溃瞬间,这个国产大模型有解!AI启发问答关键情绪稳定
辅导孩子写作业这件事,竟难倒了一众清北爸爸、海淀妈妈。不过,最近爆火的这个国产大模型,让无数家长疯狂冲进视频留言,直接把它评为国内家长最想要的AI!
-
3B模型新SOTA!开源AI让日常调用不同大模型更简单
两位斯坦福校友创办的NEXA AI,提出了一种新的方法:采用functional token整合了多个开源模型,每个模型都针对特定任务进行了优化。
-
Karpathy点赞,这份报告教你如何用 LLaMa 3创建高质量网络数据集
事实证明,LLM 从教育内容中学习会更好更快。部分原因是普通的互联网爬取文章的价值不是很高,并且会分散训练的注意力,包含太多不相关的信息。