将门创投
优质互联网领域创作者
TA的勋章
Cobra:首个基于Mamba的多模态大语言模型
Talk预告|香港中文大学刘政哲&胡靖宇:3D内容生成-基于小波变换的三维模型生成与编辑技术
CVPR 2024 | OmniParser统一图文解析模型:文字检测识别、视觉信息抽取和表格识别
劳动节快乐!
港中文提出CLongEval中文基准测试集,准确评估大模型长上下文能力
CVPR 2024 | REAL:检索增强提升zero-shot性能,深挖视觉语言模型中的长尾分布现象
IJCAI 2024 | 基于Transformer的高效单阶段短时RGB-T单目标跟踪方法
KBS 2024 | 开放世界中的知识图谱实体嵌入
CVPR 2024 | NUS联合腾讯提出人物为中心的视频编辑框架DynVideo-E
CVPR 2024 | NARUTO:基于不确定性的主动三维重建
TechBeat社区年度大事件:2024红人榜,见证AI华人新星的力量!
北大&字节提出高效可拓展的图像生成新范式VAR
Talk预告|清华大学交叉信息研究院黄浩栩: 用基础大模型解锁通用具身智能
ICRA 2024 | GAMMA:可抓取性引导的移动操作算法
Megalodon:针对大规模预训练的Mega改进
CVPR 2024 | VLP:语言大模型助力,以车辆智能体为中心的全新自动驾驶学习范式
基于可信执行环境的模型部署安全性保障研究
CVPR 2024 | 从1秒到2小时,Meta联合UNC提出超长视频字幕生成模型ReCap
CVPR 2024 | FairCLIP:第一篇多模态视觉语言大模型公平性研究
Talk预告 | 香港科技大学杨帅:DDSM-扩散模型加速的新角度
Cobra:首个基于Mamba的多模态大语言模型
Talk预告|香港中文大学刘政哲&胡靖宇:3D内容生成-基于小波变换的三维模型生成与编辑技术
CVPR 2024 | OmniParser统一图文解析模型:文字检测识别、视觉信息抽取和表格识别
劳动节快乐!
港中文提出CLongEval中文基准测试集,准确评估大模型长上下文能力
CVPR 2024 | REAL:检索增强提升zero-shot性能,深挖视觉语言模型中的长尾分布现象
IJCAI 2024 | 基于Transformer的高效单阶段短时RGB-T单目标跟踪方法
KBS 2024 | 开放世界中的知识图谱实体嵌入
CVPR 2024 | NUS联合腾讯提出人物为中心的视频编辑框架DynVideo-E
CVPR 2024 | NARUTO:基于不确定性的主动三维重建
TechBeat社区年度大事件:2024红人榜,见证AI华人新星的力量!
北大&字节提出高效可拓展的图像生成新范式VAR
Talk预告|清华大学交叉信息研究院黄浩栩: 用基础大模型解锁通用具身智能
ICRA 2024 | GAMMA:可抓取性引导的移动操作算法
Megalodon:针对大规模预训练的Mega改进
CVPR 2024 | VLP:语言大模型助力,以车辆智能体为中心的全新自动驾驶学习范式
基于可信执行环境的模型部署安全性保障研究
CVPR 2024 | 从1秒到2小时,Meta联合UNC提出超长视频字幕生成模型ReCap
CVPR 2024 | FairCLIP:第一篇多模态视觉语言大模型公平性研究
Talk预告 | 香港科技大学杨帅:DDSM-扩散模型加速的新角度