• 百度全新视觉语言模型闪耀全球,连续多日领跑OCR领域

    10月16日,百度飞桨团队发布了视觉语言模型PaddleOCR - VL,在全球OCR领域引发轰动。它以0.9B参数规模,在权威评测中取得92.56分,超越主流模型登顶全球OCR榜单。截至10月21日,它在Huggingface全球模型趋势榜连续5天居首。该模型功能强大,支持109种语言识别,能精准解析文本、表格等,还具备文档语义结构重建能力,在科研、发票识别等领域实用价值高。另外,DeepSeek团队论文致谢PaddleOCR,揭示业界开源OCR模型是为大模型训练提供数据标注能力。对于想提升工作效率、紧跟技术潮流的人来说,了解这个模型能让你在工作中更具竞争力,不妨深入阅读原文一探究竟。

    0 2025-10-24
  • 中国科大携手字节跳动:全新长视频生成模型引领行业变革

    科技飞速发展,视频生成技术领域迎来大变革!中国科学技术大学和字节跳动将联合发布端到端长视频生成模型,这可是该领域的里程碑。它能直接生成分钟级、480p 分辨率、24 帧/秒的高质量视频,还支持多镜头流畅切换。核心算法 MoGA 是创新的注意力机制,优化后能处理大量上下文信息,降低计算成本,让长时间、多场景视频生成成为现实。传统模型只能生成几秒短片,而它能“一次性”生成连贯“迷你短片”,拓展了应用范围。而且 MoGA 兼容性强,能和现有加速库集成,有强大产业落地潜力,可用于影视、广告等多领域。这是国内首个实现分钟级长视频生成的系统,有望让中国在该领域跻身全球前列。想了解更多,点击链接查看。这一成果将为相关行业带来新机遇,让创作更高效。

    0 2025-10-24
  • 腾讯全新发布 IMA 2.0:功能大升级,开启智能知识管理新时代

    10月23日,腾讯在活动上推出全面升级的IMA 2.0版本。它是业界首个融合Agent能力的个人知识库,新特性超厉害!“任务模式”把知识库变成智能伙伴,用户用自然语言发指令,它能理解意图、拆解步骤、调用工具完成任务,还能自我监测修正。还能智能生成播客内容,适用于多种场景。知识库也全面升级,有“AI要点”“多任务并行”“协作共享”等功能。过去一年,IMA服务20多个行业,月活增长惊人。很多资深用户分享了高阶用法,像医生、海关团队、老师等都用它高效解决问题。IMA 2.0让知识库变成智能生产力工具,能为大家带来更高效、智能的知识管理和任务执行体验,普通人用它能提升工作效率。

    0 2025-10-24
  • 《Kimi K2性能惊艳超越GPT - 5,月之暗面再迎数亿美金融资热潮》

    国内大模型领域的明星创业公司月之暗面有重磅消息传出,它即将完成新一轮数亿美元融资,距离上次约3亿美元融资时间间隔不长,这体现资本市场对其信心高涨。今年初,因DeepSeek爆发,月之暗面一度沉寂,主力产品Kimi淡出公众视线。但7月它凭借全新升级的Kimi k2模型强势回归,不仅在国内引发热议,还在国际科技圈引起轰动。美国知名投资人让公司切换到Kimi k2,Vercel首席执行官称其在测试中性能超越GPT - 5和Claude4.5。这让月之暗面重新受资本关注,站上全球AI舞台中央。这一消息能让大家看到AI领域的新动态和潜力,为关注科技发展的人带来新机遇和思考。

    0 2025-10-24
  • OpenAI 收购 SAI 团队,ChatGPT 深度嵌入 macOS 工作流步伐加快

    近日,OpenAI 有大动作,它成功收购了 Mac 平台 AI 语言界面应用 Sky 背后的 SAI 团队。这可是为了让 ChatGPT 更好地融入 Mac 用户日常工作。Sky 应用在 Mac 界很有名,功能强大,能理解上下文、自适应调整,还能和其他应用协同,使用起来又便捷又高效。收购完成后,Sky 团队会加入 OpenAI,将技术和 Mac 深度整合,契合 OpenAI 推动自动化的战略,给 Mac 用户带来新工作体验。而且 SAI 团队技术实力强,之前开发的 Workflow 应用被苹果收购。此次收购已通过审核,OpenAI 首席执行官之前还持有 Sky 股份。这意味着使用 Mac 工作的人,之后工作效率可能大幅提升,能更轻松完成任务。想了解更多,就去看原文吧!

    0 2025-10-24
  • 昆仑万维SkyReels AI视频产品新版11月将启,引领行业新变革

    昆仑万维旗下的AI视频产品SkyReels要搞大事情啦!全新版本预计11月初上线,在昆仑万维AI战略加持下,有望巩固其在全球AI视频赛道的领先地位,推动“人人可参与专业视频创作”愿景实现。现在全球用户能上官网申请加入测试提前体验。过去两年,技术团队攻克诸多核心难题,先后发布多个模型,像SkyReels - V1精准驱动表情动作,SkyReels - V2让创作进入新阶段,SkyReels - A3实现全模态音频驱动数字人创作。而且它还开源多个最优性能模型算法,促进AI行业发展。这产品能提升专业团队效率,打破普通创作者技术门槛。想了解更多,就去官网看看吧。对想参与视频创作的人来说,这可是提升效率、开启创作大门的好机会。

    2 2025-10-23