当前位置:首页 » 《我的小黑屋》 » 正文

20240920 每日AI必读资讯

11 人参与  2024年10月14日 19:20  分类 : 《我的小黑屋》  评论

点击全文阅读


  阿里通义千问开源Qwen2.5系列模型:Qwen2-VL-72B媲美GPT-4

- Qwen2.5系列模型开源,包括通用语言模型和专业领域模型,提升知识获取、编程和数学能力。

- 模型支持长文本处理,生成最多8K tokens内容,对29种以上语言提供支持。

- Qwen2-VL-72B模型取得显著改进,在指令执行、长文本生成、数据理解和结构化输出方面表现优异。

?详情链接:https://modelscope.cn/studios/qwen/Qwen2.5

? 新SOTA来了:国产9B模型多项得分超4o-mini,中国出海电商已经用上了-CSDN博客

Luma AI 推出 Dream Machine API 

开发者可将AI视频生成能力无缝集成到自己的产品中

无需掌握复杂的提示工程,用户可以通过简单的文本指令生成视频。

Dream Machine API 提供直观的系统来创建和编辑视频,用户无需在应用中构建复杂的工具,也不需要切换到其他视频编辑器。

?在线体验:https://huggingface.co/spaces/akhaliq/dream-machine

?详细:https://xiaohu.ai/p/13752

YouTubeVeo 引入Google DeepMind 的 Veo 模型 !为创作者想象插上翅膀

- 创作者可使用Veo创作视频

- 这些AI技术将集成到YouTube Shorts 的 Dream Screen 功能中。

- Dream Screen 首先使用 Imagen 3 生成四个不同的图像,创作者可以从这些选项中选择符合他们偏好风格、构图或美学的图像。

- 选择图像后,然后Veo模型将基于所选图像生成6秒长的高质量背景视频,以实现用户的创意愿景。

? YouTubeVeo 引入Google DeepMind 的 Veo 模型 创作者可使用Veo创作视频 – XiaoHu.AI学院

腾讯出品!AI音频模型 EzAudio AI,让文本秒变逼真声音

- EzAudio 是由约翰霍普金斯大学与腾讯合作推出的新型文本转音频生成模型,标志着音频技术的一次重大进步。

- 该模型通过创新的架构和技术,生成的音频样本在质量上优于现有开源模型,具备广泛的应用潜力。

- 随着技术的发展,伦理和责任使用的问题逐渐突显,EzAudio 的公开研究代码也为未来的风险与收益提供了广泛的检验机会。

?详情链接::https://huggingface.co/spaces/OpenSound/EzAudio

2024AI智能体应用洞察半年报:AI类APP月活超6600万

 - AI类应用月活跃用户数超过6600万,展示AI技术快速发展和普及。

- AI应用形成八大玩法门类,商业化路径开启。

- 智能体服务解决用户需求,微信生态重要渠道,商业模式探索中。


点击全文阅读


本文链接:http://zhangshiyu.com/post/171877.html

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

关于我们 | 我要投稿 | 免责申明

Copyright © 2020-2022 ZhangShiYu.com Rights Reserved.豫ICP备2022013469号-1