量子位

量子位

网易号

关注
17.5万粉丝
0关注
7.7万被推荐
IP属地:广东

《量子位》官方网易号

2枚勋章

2次获得编辑精选

追踪人工智能动态

  • Sora新视频只发TikTok:OpenAI 4天涨粉10万
    59分钟前
  • OpenAI员工自曝996作息表,网友:真正的卷不需要强迫

    1小时前
    10跟贴
    图片
  • #Adobe将在PDF推出AI助手# Adobe正在为其Acrobat PDF管理软件添加一种新的生成性人工智能体验,旨在通过使长篇文档中的信息更易于查找和理解来“彻底改变数字文档体验”。在Adobe的新闻稿中宣布为“Acrobat中的AI助手”的新工具被描述为一个“对话引擎”,它可以总结文件内容、回答问题,并根据内容推荐更多信息,使用户能够“轻松地与文档对话”以获取所需信息。从今天开始,付费Acrobat用户可以开始使用这项功能,目前处于测试版阶段。
    行业密探
  • #LeCun定义世界模型# 关于世界模型是什么,有很多混淆。这是我(LeCun)的定义:给定:- 观察值 x(t)- 世界状态的先前估计 s(t)- 动作提议 a(t)- 潜在变量提议 z(t)世界模型计算:- 表示:h(t) = Enc(x(t))- 预测:s(t+1) = Pred( h(t), s(t), z(t), a(t))其中- Enc() 是编码器(一个可训练的确定性函数,例如神经网络)- Pred() 是隐藏状态预测器(也是一个可训练的确定性函数)- 潜在变量 z(t) 表示能够让我们精确预测发生什么的未知信息。它必须从分布中采样或在一组中变化。它参数化了(或分布)一系列可能的预测。关键在于从观察三元组 (x(t), a(t), x(t+1)) 中训练整个模型,同时防止编码器坍缩到一个忽略输入的平凡解。自回归生成模型(例如LLMs)是一个简化的特殊情况,其中1. 编码器是恒等函数:h(t) = x(t)2. 状态是过去输入的窗口3. 没有动作变量 a(t)4. x(t) 是离散的5. 预测器计算 x(t+1) 的结果分布,并使用潜在变量 z(t) 从该分布中选择一个值。方程简化为:s(t) = [x(t), x(t-1), ..., x(t-k)]x(t+1) = Pred( s(t), z(t), a(t))在这种情况下没有坍缩问题。
    行业密探
  • #OpenAI一线员工作息表# OpenAI员工Jason Wei发布自己在公司一天的时间作息表。不得不说是有够卷的[9:00am] 起床[9:30am] 乘坐Waymo前往旧金山的任务地点。从Tartine买鳄梨吐司[9:45 am] 背诵OpenAI宪章。向优化之神祈祷。学习苦涩的教训[10:00am] 会议(Google Meet)。讨论如何在更多数据上训练更大的模型[11:00am] 编写代码,用于在更多数据上训练更大的模型。搭档是Hyung Won Chung[12:00pm] 在食堂吃午餐(素食,无麸质)[1:00pm] 实际上开始在更多数据上训练大型模型[2:00pm] 调试基础设施问题(为什么我从主分支拉取了代码?)[3:00pm] 照看模型训练。和Sora玩耍[4:00pm] 向工程师介绍上述在更多数据上训练的大型模型[4:30pm] 短暂休息,坐在鳄梨椅上。好奇Gemini Ultra到底有多好[5:00pm] 头脑风暴,为模型提出潜在的算法改进[5:05pm] 得出结论,算法更改风险太大。更安全的做法是仅仅扩展计算和数据[6:00pm] 晚餐。和Roon一起吃蛤蜊浓汤[7:00pm] 通勤回家[8:00pm] 喝一杯酒,然后继续编码。Ballmer的巅峰即将到来[9:00pm] 分析实验运行。我和wandb有着爱恨交织的关系[10:00pm] 发起实验,让它在夜间运行,以便明天早上得到结果[1:00am] 实验实际上已经启动[1:15am] 睡觉时间。Satya和Jensen在上方观望。压缩是你需要的一切。晚安
    行业密探
  • 我又又叒叕产生10W+爆款啦,大家快来围观吧~
  • 【#黄仁勋谈算力不能只想加计算机# 】英伟达CEO黄仁勋谈算力,只想着加计算机,你得烧掉14个地球的能源。
    行业密探
  • #马斯克称首例脑机接口芯片植入者完全恢复# 爆料称,马斯克在今晚参加的X Spaces上宣布,首个脑机接口芯片植入者已经完全恢复,患者仅用意念就能控制鼠标。
    行业密探
  • #DeepMind想把大模型能力和AlphaGo结合# Google DeepMind首席执行官戴米斯·哈萨比斯(Demis Hassabis)近日在接受《连线》杂志采访时表示,发展AI不能只靠堆硬件。同时他提到,想把大模型和AlphaGo能力结合。
    行业密探
  • #谷歌推出PaLM2VAdapter#
    行业密探
  • #瑞幸咖啡开招大模型人才# #瑞幸咖啡大模型# 一则招聘信息显示,瑞幸咖啡开招AIGC/LLM算法工程师,年薪在40到77万不等!转需或许,没过多久能看到瑞幸咖啡大模型了……
    行业密探
  • 2步生成25帧高质量动画,计算为SVD的8% | 在线可玩

    23小时前
    2跟贴
    图片
  • 10000+摄像头连上别人家!网络故障导致中断重启,官方甩锅第三方

    1天前
    3跟贴
    图片
  • #GeminiPro新模型拒绝回答# OpenAI和ChatGPT相关,有网友发现,在测试Gemini pro新模型时,出现一种以前在其他模型中从未见过的新颖行为:完全拒绝返回响应中任何包含“OpenAI”或“GPT”的文本。除此之外还有包括百度、Ernie 和 Microsoft 也属于类似的禁止术语。一旦回答,就会出现“ finishReason: OTHER ”错误。但像Anthropic、Claude、Cohere、Falcon、LLaMA 和 Vicuna 等其他术语则可以。让人不免想起此前,问Gemini是谁时,结果回答自己是文心一言……挺好的,这下直接拒绝回答了。
    行业密探
  • #威尔史密斯本尊整活Sora# 一年前最火的AI视频是“魔性威尔史密斯吃面”,在Sora时代进化成什么样了?自从Sora公布以来,每天都有网友@奥特曼想看这段吃面的复刻,求求了。现在大家有眼福了!!可能眼尖的朋友已经发现,下方视频并没有打上OpenAI水印,明显是个假AI视频——但他确是真·威尔史密斯本人出镜表演的_没错,这位国际巨星亲自上阵,给大伙整了个大活。他还假装很震惊,配上“形势已经失控了!”的文字,结结实实骗过了不少网友。有人足足看了5次才纳过闷来。最令人毛骨悚然的是,你很难判断这是真实表演还是AI生成的。甚至有人开始思考,以后AI真的学到这段训练数据的时候,得有多困惑。威尔史密斯本尊整活Sora,网友:我分不清!我真的分不清啊
    行业密探
  • #Midjourney尴尬亮相学术界# 太离谱!有人用Midjourney给生物学论文配图,画得漏洞百出,结果还一路顺畅成功发表???比如下面这幅Figure 1,就被大家“一起来找茬”,轻易找出了5处不符合现实的情况。更令人费解的是,接收并发表该篇论文的期刊,是生物学SCI期刊 Frontiers in Cell and Developmental Biology(《细胞与发育生物学前沿》,为方便阅读,下文统一简称Frontiers),影响因子在5.5左右.发表3天,该论文就有30万+的阅读量,以及超16000的下载量。被发现并指出后, Frontiers采取的紧急公关策略简单粗暴:撤稿Midjourney尴尬亮相学术界:为生物学论文配图,错得好离谱!围观网友嘲讽拉满
    行业密探
  • Midjourney尴尬亮相学术界:为生物学论文配图,错得好离谱!
    1天前
    9跟贴
  • #大模型最快推理芯片易主# :每秒500tokens干翻GPU!谷歌TPU人马打造太快了太快了。一夜间,大模型生成已经没什么延迟了……来感受下这速度。眼花缭乱了吧,生成速度已经接近每秒500 tokens。还有更直观的列表对比,速度最高能比以往这些云厂商快个18倍吧。(这里面还有个熟悉的身影:Lepton)网友表示:这速度简直就是飞机vs走路。值得一提的是,这并非哪家大公司进展——初创公司Groq,谷歌TPU团队原班人马,基于自研芯片推出推理加速方案。(注意不是马斯克的Grok)据他们介绍,其推理速度相较于英伟达GPU提高了10倍,成本却降低到十分之一。换言之,任何一个大模型都可以部署实现。目前已经能支持Mixtral 8x7B SMoE、Llama 2的7B和70B这三种模型,并且可直接体验Demo。他们还在官网上喊话奥特曼:你们推出的东西太慢了……大模型最快推理芯片一夜易主:每秒500tokens干翻GPU!谷歌TPU人马打造,喊话奥特曼:你们也太慢了
    行业密探
  • 大模型最快推理芯片一夜易主:每秒500tokens干翻GPU!

    1天前
    63跟贴
    图片
  • 威尔史密斯本尊整活Sora,网友:我分不清!我真的分不清啊

    1天前
    51跟贴
    图片
正在载入...
正在载入...