Transformer图片 - 搜索 News

2025自动驾驶最大技术「黑马」：AI论文高引TOP3，比Transformer快2.8倍 ...

贾浩楠发自副驾寺智能车参考 | 公众号 AI4Auto现在最前沿、最被学界追捧、被产业界寄予厚望的自动驾驶技术，是什么？地平线创始人余凯博士最新的朋友圈揭晓了答案：Vision Mamba，全球年度AI论文高引TOP ...

ITheat热点科技 on MSN1 天

CES 2025暴走三天，这一场科技春晚，我看到了硬核新品和情绪价值！

1月7日，被称为“科技界春晚”的CES 2025（国际消费类电子产品展览会）在美国拉斯维加斯拉开帷幕。

每日经济新闻 on MSN1 天

每经AI快讯，有投资者在投资者互动平台提问：openAI的推出推理模型01以及chatGTP是基于Transformer架构研发的，贵公司的的星汉大模型也是基于Transformer架构，根据之前披露的互动信息来看，星汉大模型主要是视频解析，这款大模 ...

3 天

英伟达RTX 50系新显卡发布，AI计算又翻开了崭新一页？

当地时间2025年1月6日下午，英伟达 CEO黄仁勋在美国拉斯维加斯进行了 CES2025 媒体日的最后一场主题演讲。在活动中，黄仁勋发布了包括 RTX50系列 ...

4 天

2025年AI大模型的发展方向在哪里？

展望 2025 年，预计企业人工智能格局将出现三个进一步的转变：从训练越来越大的模型转向设计复合人工智能系统，对人工智能的可观测性和评估的重视程度不断提高，以及出现可信的变换器架构替代品。每一个趋势都建立在推理角色不断扩大的基础上。

5 天

深度学习的历史与DeepSeek的中国创新之路

在科技圈中，深度学习绝对是个备受瞩目的热门词汇，仿佛是时代的探险家，利用深层神经网络（DNN）在纷繁复杂的信息海洋中探寻未知的奥秘。其"深度"一词，恰如其分地包含了层层深入的学习过程，能够从混沌的数据中自行提取出有价值的特征，不再需要人类费心费力地精心设计。无论是进行图像识别还是自然语言处理，深度学习的存在无疑是它们的幕后英雄。那么，当GPT或Transformer的名字浮现在你耳边时，是不是也 ...

来自MSN11 天

揭秘DeepSeek-V3“物美价廉”的背后：蒸馏技术存在天花板，依赖合成 ...

深度求索DeepSeek-V3模型在业界掀起波澜。据悉，该模型采用数据蒸馏技术，将复杂数据简化为高质量数据，提升了训练效果。然而，有学者指出，蒸馏技术虽能提高效率，但可能导致“学生模型”无法超越“教师模型”，甚至影响创新。此外，DeepSeek-V3 ...

快科技17 天

全球首发Chiplet 国产自驾芯片来了！北极雄芯启明935A成功点亮

得益于大熊星座NPU天然支持Transformer结构，初步支持的模型有Yolo系列、ResNet50、PSPNet、PointNet++、TrafficSign_Retinanet、BevDet、miniCPM、Unet_ResNet50 ...

51CTO17 天

阿里推出“眼睛”模型QVQ：全球第一个用于视觉推理的开放权重模型

该模型表现出色，有效缩小了与领先的最先进的 o1 模型之间的差距开源大语言模型宇宙又来了一个强劲对手。Transformer作者参与创立的Cohere公司推出的大模型CommandR在可扩展、RAG和工具使用三个方面具有显著的优势。

36氪22 天

「上海维享时空」完成数千万元融资，打造城市元宇宙空间计算平台 ...

城市元宇宙未来的形态是什么？ PGVerse CEO丁志刚认为，“数实融合”的空间体验将是城市元宇宙未来的主要形态。随着“数实融合”的实现，用户与 ...

新浪网23 天

Meta开发新模型BLT，字节级处理超越传统Token架构

为了解决这个问题，Meta、美国华盛顿大学和美国芝加哥大学的科学家们共同开发出了一种突破性的新型 AI 架构，取名为字节潜在 Transformer（BLT ...

极客公园25 天

具身智能出不来「 ChatGPT」，为什么？

如果只基于 Transformer 架构的大语言模型（如 ChatGPT），人类无法实现具 ... 很多大语言模型都是根据互联网上的语料信息、图片或视频训练出来的，但这些内容只是一堆静态的记忆，训练出来的东西跟物理世界是相违背的。这里有一个简单的例子，左边是由 Stable ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果