打开网易新闻 查看更多图片

脑科学动态

欺骗大脑的内部GPS,网格细胞对自我定位错觉的反应

不同性别的小鼠表达同情的行为有所不同

新生小鸡破解长达几个世纪的认知和感觉争论

大脑皮层在神经发育中的自组织能力

AI行业动态

阿里云通义千问降价97%

百度文心大模型免费开放

微软发布Phi-3模型:中小型AI性能超群

微软发布最强AI电脑:Copilot+ PC

AI研发动态

触觉带来3D空间感知的新可能

人工智能芯片可以感知时间

医疗大模型在医学领域的应用与挑战

我们距离通用人工智能还有多远?

大语言模型的不确定性表达如何影响用户信任和依赖

脑科学动态

欺骗大脑的内部GPS,网格细胞对自我定位错觉的反应

韩国科学技术研究院(KIST)和瑞士洛桑联邦理工学院(EPFL)的研究团队成功诱导了自我位置的错觉,并观察到人类大脑中网格细胞的相应活动。研究通过结合兼容MRI的虚拟现实(VR)技术和多感官身体刺激,诱导受试者产生自我位置错觉,并在此过程中通过功能性磁共振成像(fMRI)测量网格细胞(grid cell)活动。

结果显示,纯认知的自我位置变化(无任何视觉环境变化)也会引发网格细胞活动,这是首次通过临床研究表明,多感官身体刺激可以在没有任何导航行为的情况下,激活网格细胞活动。网格细胞位于内嗅皮层(EC),通过整合环境和多感官身体信号,编码个体在空间中的位置。研究发现,自我位置的错觉变化与传统虚拟导航时的网格细胞样表示(GCLR)在强度和方向上具有相似性。这一发现不仅揭示了大脑中的GPS坐标响应于身体物理位置和认知活动,还为未来通过脑图像分析客观诊断幻觉症状提供了可能。研究发表在 PNAS 上。

#认知科学 #网格细胞 #虚拟现实 #自我位置错觉 #多感官刺激

阅读论文:

Moon, Hyuk-June, et al. “Changes in Spatial Self-Consciousness Elicit Grid Cell–like Representation in the Entorhinal Cortex.” Proceedings of the National Academy of Sciences, vol. 121, no. 12, Mar. 2024, p. e2315758121. pnas.org (Atypon), https://doi.org/10.1073/pnas.2315758121.

不同性别的小鼠表达同情的行为有所不同

这项研究由中山大学和中国科技大学的研究团队共同完成,旨在探讨小鼠在面对其他小鼠痛苦时的神经和行为反应差异。研究人员将两只小鼠放置在侧室,一只小鼠被注射引起腹痛,另一只没有任何处理,同时将观察者小鼠放在中央区域,观察其行为反应。

实验显示,雄性小鼠在初期探索环境时与雌性小鼠相似,但在实验后期,雄性小鼠表现出更多的梳理行为,而雌性小鼠则更倾向于靠近并嗅探疼痛小鼠。研究表明,这些行为差异源于不同的神经回路,涉及嗅皮层(PiC)神经元群体。这些神经元群体具有不同的基因表达特征,并受转录因子和性激素调控。具体来说,雌性小鼠的PiC → PrL通路被激活,导致其对疼痛同伴表现出社会偏好;而雄性小鼠的PiC → MeA通路被激活,导致其表现出过度的自我梳理行为。研究揭示了社会同伴的内部状态如何通过性别二态机制在分子、细胞和回路水平上进行处理,并提供了有关高等脑功能中性别差异神经机制的见解。研究发表在 Neuron 上。

#认知科学 #神经科学 #社会行为 #性别差异 #同情行为

阅读论文:

Fang, Shunchang, et al. “Sexually Dimorphic Control of Affective State Processing and Empathic Behaviors.” Neuron, vol. 112, no. 9, May 2024, pp. 1498-1517.e8. www.cell.com, https://doi.org/10.1016/j.neuron.2024.02.001.

新生小鸡破解长达几个世纪的认知和感觉争论

人类一直在探讨视觉和触觉之间的感知联系是否需要通过经验来建立。最早提出这一问题的是爱尔兰哲学家威廉·莫利纽兹。最近,一个由神经科学家和生物学家组成的国际研究团队通过对新生小鸡的实验,为这一问题提供了新的见解。

研究人员在完全黑暗的环境中孵化小鸡,然后分别让它们接受光滑和凹凸不平的触觉刺激24小时。在此之后,他们在有光照但不能进行触摸的环境下对小鸡进行视觉识别测试。实验中使用的刺激物是光滑的和凹凸不平的木质立方体。研究发现,接受光滑刺激的小鸡在视觉测试中更倾向于接近光滑的物体,而接受凹凸不平刺激的小鸡则更趋向于接近凹凸不平的物体。结果表明,新生小鸡能够在没有视觉经验的情况下,仅通过触觉模式习得物体的形状,并使用基于触觉经验的表象来进行视觉识别任务。这一发现表明,从触觉到视觉的跨模态识别,并不需要之前同时具有多模态刺激的经验。这项研究成果发表在Biology Letters上。

#认知科学 #跨模态识别 #小鸡实验 #视觉识别

阅读论文:

Versace, Elisabetta, et al. “First-Sight Recognition of Touched Objects Shows That Chicks Can Solve Molyneux’s Problem.” Biology Letters, vol. 20, no. 4, Apr. 2024, p. 20240025. royalsocietypublishing.org (Atypon), https://doi.org/10.1098/rsbl.2024.0025.

大脑皮层在神经发育中的自组织能力

大脑皮层在发育过程中如何从无序的输入中形成有序的神经活动模式一直是神经科学的一个重要问题。由明尼苏达大学医学院的助理教授Gordon Smith和法兰克福高级研究所的教授Matthias Kaschube领导的研究团队,通过最新的光遗传学技术,揭示了大脑皮层的自组织能力。

研究团队利用同时进行的广域钙成像和光遗传学技术,研究了幼年雪貂皮层在眼睛未睁开前的神经活动模式。他们通过均匀的光刺激观察到皮层网络将这些刺激转化为具有特征空间波长的多样化模块化模式。当光刺激匹配这个波长时,会选择性地偏向激发的活动模式,而不同波长的刺激则会使活动转向这一特征波长,揭示了输入驱动和网络内在组织活动倾向之间的动态平衡。实验结果显示,早期自发的皮层活动结构与光刺激诱导的活动模式强烈重叠,表明两者有共同的机制,成为形成有序柱状图(columnar maps)的基础,这些图是大脑中感觉表示的基础。此研究表明,大脑皮层在发育过程中能够通过内部反馈机制自我组织,而不依赖外部来源。这一发现验证了早期关于大脑发育的理论假设,并为理解神经发育障碍提供了新的视角。研究发表在Nature Communications上。

#神经科学 #自组织 #光遗传学 #皮层发育 #局部激发与侧向抑制

阅读论文:

Mulholland, Haleigh N., et al. “Self-Organization of Modular Activity in Immature Cortical Networks.” Nature Communications, vol. 15, no. 1, May 2024, p. 4145. www.nature.com, https://doi.org/10.1038/s41467-024-48341-x.

AI 行业动态

阿里云通义千问降价97%

近日,阿里云宣布旗下通义千问系列大模型大幅降价,部分型号降幅高达97%。其中,性能对标GPT-4的Qwen-Long模型,API输入价格从0.02元/千tokens降至0.0005元/千tokens,仅需1元即可购买200万tokens。此次降价覆盖商业化和开源的9款模型,为企业和程序员带来巨大优惠。

此次降价中,Qwen-Long以其支持1000万tokens的长文本输入能力,和降价后的超低价格,成为最受瞩目的焦点。此外,刚发布不久的Qwen-max API输入价格也降至0.02元/千tokens,降幅达到67%。在开源模型方面,Qwen1.5-72B和Qwen1.5-110B的输入价格分别下降75%以上。

阿里云表示,此次降价旨在降低大模型的使用门槛,满足用户对长文本处理的需求。数据显示,模型输入调用量通常是输出调用量的8倍,因此通过大幅降低输入token价格,可以让企业使用长文本处理时更加经济实惠。

#阿里云 #通义千问 #大模型 #AI #价格战

百度文心大模型免费开放

近日,百度宣布旗下两款主力大模型——ERNIE Speed和ERNIE Lite全面免费开放,即刻生效。

ERNIE Speed和ERNIE Lite这两款大模型发布于今年3月,支持8K和128K的上下文长度,展示了强大的处理能力。百度官方表示,ERNIE Speed是2024年最新发布的自研高性能大语言模型,具备出色的通用能力和推理性能,特别适合作为基座模型进行精调,以更好地应对特定场景的问题。ERNIE Lite则是一款自研的轻量级大语言模型,在确保优异效果的同时兼顾推理性能,非常适合在低算力AI加速卡上进行推理使用。

#百度 #大模型免费 #人工智能 #ERNIE #AI普及

微软发布Phi-3模型:中小型AI性能超群

近日,微软发布了全新Phi-3 Vision模型,以及Phi-3 Small 7B和Phi-3 Medium 14B两个型号。Phi-3 Medium 14B的性能堪比Mixtral 8x22B和Llama 3 70B,甚至超过了Command R+ 104B和GPT 3.5。而Phi-3 Small 7B的表现也超过了Mistral 7B和Llama 3 8B。这些型号的上下文长度支持4K和128K,使其在处理长文本时更加高效。

在模型规模上,Phi-3 Medium为14B,Small为7.5B,而Vision则为4.2B。这些模型通过使用4.8T令牌,在512个H100 GPU上进行了42天的训练,数据包括10%的多语言数据,以及经过严格过滤和合成的数据,如科学和编程教材。

新发布的Phi-3模型还采用了新的分词器,拥有10万词汇量,进一步提高了处理文本的精确度。此外,这些模型的权重兼容性广泛,支持AWQ、INT 4、ONNX和transformers,方便用户在不同平台和应用中部署。

#微软 #Phi-3 #人工智能 #AI模型 #机器学习

阅读更多:

https://huggingface.co/collections/microsoft/phi-3-6626e15e9585a200d2d761e3

微软发布最强AI电脑:Copilot+ PC

5月20日,微软在其特别活动上发布了一款全新的Windows PC——Copilot+ PC。这款专为人工智能(AI)设计的电脑,融合了CPU、GPU和高性能神经处理单元(NPU),并与Azure云中的大语言模型(LLM)和小语言模型(SLM)协同工作,带来了前所未有的性能提升。

微软表示,Copilot+ PC是迄今为止最快、最智能的Windows PC。其强大的新型芯片能达到每秒40万亿次操作(TOPS),具备全天电池续航能力,并能访问最先进的AI模型。新功能Recall可以帮助用户轻松找到并记住PC中看到的内容;Cocreator功能允许用户几乎实时生成和优化AI图像;实时字幕功能可以将40多种语言的音频翻译成英文,打破语言障碍。

Copilot+ PC的NPU性能超过40万亿次操作每秒(TOPS),在AI工作负载上的性能提升高达20倍,效率提升高达100倍。续航方面,Copilot+ PC在一次充电中能提供22小时的视频播放或15小时的网页浏览,比苹果的MacBook Air 15”更具优势。

这款PC还拥有几乎90%的原生Arm应用程序支持,并且仿真应用的性能提升超过两倍。它利用强大的Qualcomm Snapdragon X Elite处理器,内置神经处理单元,为AI加速能力提供保障。Microsoft Pluton安全处理器则确保了设备的高级别安全性。

微软还推出了多个新功能,如Windows Recall、Cocreator和Live Captions,进一步提升用户体验。Copilot+ PC将在6月18日正式发货,起售价为999美元,由Microsoft Surface以及Acer、ASUS、Dell、HP、Lenovo和Samsung等OEM合作伙伴提供。

#微软 #AI电脑 #Copilot+PC #人工智能 #高性能

AI 研发动态

触觉带来3D空间感知的新可能

Reichman大学Ivcher脑、认知与技术研究所的研究团队发表了一项研究,展示了大脑的可塑性和多感官整合的新视角。研究团队包括Adi Snir和Katarzyna Ciesla-Seifer等人。

研究团队开发了一种名为触觉运动算法(TMA,Touch-Motion Algorithm)的新技术,探索触觉如何帮助个体感知外部3D信息。在一个配备了97个扬声器的高阶环绕声设施中进行了四项实验,通过360度的听觉场景,研究人员比较了参与者在使用TMA时与单纯听觉条件下的表现。

实验结果显示,参与者能够通过指尖的振动触觉输入快速学习并高精度地定位围绕他们的各种声音轨迹。在没有任何事先培训的情况下,他们在接收音频触觉反馈时的准确性显著超过随机水平,并且与听觉能力相当。研究还表明,听力障碍者在听觉源分离方面面临特别大的挑战,而触觉和听觉信息的整合能够显著提高他们在复杂环境中的表现。研究发表在 iScience 上。

#神经技术 #触觉感知 #3D空间感知 #多感官整合 #辅助技术

阅读论文:

Snir, Adi, et al. “Localizing 3D Motion through the Fingertips: Following in the Footsteps of Elephants.” iScience, vol. 27, no. 6, June 2024. www.cell.com, https://doi.org/10.1016/j.isci.2024.109820.

人工智能芯片可以感知时间

在全球AI能耗预期急剧增长的背景下,密歇根大学的研究团队开发了一种具有可调弛豫时间的忆阻器,能够显著提高AI处理时的能效。该团队由工程学教授魏鲁和材料科学与工程副教授John Heron共同领导,并与俄克拉荷马大学、康奈尔大学和宾夕法尼亚州立大学的研究人员合作。

这项研究使用了基于熵稳定氧化物的单晶忆阻器,通过调整氧化镁的组成,实现了从159到278纳秒不等的内部时间常数。这些忆阻器在超导材料YBCO上构建,通过指导氧化镁、钴、镍、铜和锌的组织结构,达到了理想的性能。研究团队创建了一个简单的忆阻器网络,能够识别从零到九的声音。在测试中,这个网络在音频输入完成前就能识别出各个数字。研究表明,这种新型材料系统可以在不改变时间常数的情况下,使AI芯片的能效提高六倍。这项研究发表在Nature Electronics上。

#神经技术 #忆阻器 #人工智能 #能效提升 #熵稳定氧化物

阅读论文:

Yoo, Sangmin, et al. “Efficient Data Processing Using Tunable Entropy-Stabilized Oxide Memristors.” Nature Electronics, May 2024, pp. 1–9. www.nature.com, https://doi.org/10.1038/s41928-024-01169-1.

医疗大模型在医学领域的应用与挑战

随着大型语言模型(LLMs)在自然语言处理任务中取得的显著成果,研究者们开始探索将这些强大的模型应用于医疗领域的潜力。最新论文综述了医疗大模型的发展、应用及其面临的挑战。

在模型发展方面,研究者们通过预训练和微调的方法,利用大规模医学文本语料库如PubMed和MIMIC-III,对LLMs进行训练和优化,赋予其丰富的医学知识和推理能力。预训练可以从头开始构建模型,而微调则通过现有通用LLMs基础上进一步训练,以适应医学领域的需求。

在应用方面,医疗大模型在医疗诊断、ICD编码、临床报告生成、医疗机器人、医学语言翻译、医学教育和心理健康支持等多个领域展示了其潜力。例如,医疗大模型可以辅助医生进行诊断决策、自动化临床编码、生成详细的临床报告,甚至在手术和超声检查中增强医疗机器人的表现。

然而,医疗大模型在实际应用中也面临诸多挑战。生成内容的幻觉问题、医学领域数据的限制、行为对齐以及缺乏统一的评估基准和指标,都是需要解决的问题。此外,医疗大模型在道德、法律和安全方面也需要制定相应的规范和指南,以确保其应用的可靠性和安全性。

#医疗大模型 #人工智能 #医学应用 #技术挑战 #未来方向

阅读论文:

Zhou, Hongjian, et al. A Survey of Large Language Models in Medicine: Progress, Application, and Challenge. arXiv:2311.05112, arXiv, 15 May 2024. arXiv.org, https://doi.org/10.48550/arXiv.2311.05112.

我们距离通用人工智能还有多远?

通用人工智能(AGI)的研究正逐步深入,其核心目标是实现与人类智能相媲美的多任务处理能力。近期的一项研究详细分析了AGI系统的四大核心组件,即感知、推理、记忆和元认知,为实现这一目标提供了重要的理论基础和技术路径。

AGI的感知能力通过多模态智能技术得到显著提升,能够综合处理图像、视频、音频等多种数据形式,实现更加逼真的人机交互。这不仅提高了系统的理解能力,还使得AI在处理复杂任务时更加游刃有余。

在推理方面,当前的大规模机器学习模型,如GPT-3和PALM 2,已经展示了卓越的推理能力。这些模型能够在零样本或少样本情况下,完成各种自然语言处理任务。然而,要实现真正的AGI,未来的发展必须更加注重因果推理,以实现更好的理解和泛化能力。

记忆管理则是AGI系统的另一个关键领域。通过有效的短期和长期记忆管理,AGI可以在决策过程中利用广泛的历史数据和经验。这不仅提高了系统的应对能力,还为未来的自我进化提供了基础。

元认知,即AI系统的自我意识和自我进化能力,是实现AGI的关键。这些高级认知和情感能力使得AGI能够进行自我反思和适应,不断提高自身的智能和适应性。未来的AGI系统将具备更深层次的自我意识,能够独立学习和进化。

#通用人工智能 #AI感知 #AI推理 #AI记忆 #AI元认知

阅读论文:

Feng, Tao, et al. How Far Are We From AGI. arXiv:2405.10313, arXiv, 16 May 2024. arXiv.org, https://doi.org/10.48550/arXiv.2405.10313.

大语言模型的不确定性表达如何影响用户信任和依赖

近年来,大语言模型(LLMs)在信息检索、写作和编程等领域得到了广泛应用。然而,这些模型的不完美性可能导致用户对其输出过度依赖,从而产生严重后果。为了减少这种过度依赖,研究人员建议LLMs通过自然语言表达不确定性。基于这一背景,普林斯顿大学和微软的研究团队开展了一项大规模实验,探讨不确定性表达对用户依赖和信任的影响。

在实验中,研究人员随机分配404名参与者回答一组医疗问题,部分参与者能够访问一个虚构的LLM搜索引擎的回答。研究发现,使用第一人称表达不确定性(例如,“我不确定,但...”) 能有效降低用户对系统答案的信任度和一致性,同时提高他们的回答准确率。然而,表达不确定性的具体语言使用也很重要,因为泛泛的表达效果较弱且不显著。这表明,在LLMs中采用自然语言表达不确定性可以有效减少过度依赖,但需要谨慎选择语言表述。

研究团队建议,在大规模部署LLMs之前,应该通过用户测试评估各种不确定性表达方法的有效性,并在政策制定中考虑多样性和灵活性。

#大语言模型 #不确定性表达 #用户信任 #过度依赖 #人机交互

阅读论文:

Kim, Sunnie S. Y., et al. “I’m Not Sure, But...”: Examining the Impact of Large Language Models’ Uncertainty Expression on User Reliance and Trust. 15 May 2024. arXiv.org, https://doi.org/10.1145/3630106.3658941.

整理|ChatGPT

编辑|丹雀 & 存源

追问互动

如果您对本期内容有进一步想要追问的问题或者讨论的内容,欢迎在评论区留言,或者扫描二维码添加追问微信号,发送自我介绍,加入我们的社群参与互动。如需转载,还请留言。