当前位置:首页 » 《关注互联网》 » 正文

20240517 每日AI必读资讯

18 人参与  2024年05月25日 17:25  分类 : 《关注互联网》  评论

点击全文阅读


? 大地震!OpenAI灵魂人物Ilya官宣离职

- 同一天,超级对齐团队负责人Jan Leike,在同一天官宣离职。

- 有人猜测,或与 AGI 的进展有关。

 ?大地震!OpenAI灵魂人物Ilya官宣离职,马斯克曾为其与谷歌创始人决裂...-CSDN博客 

 ?GPT-4o再秀神操作,“复现”OpenAI总裁讲课

- GPT-4o展示惊人的文本生成和图像生成能力,引起网友热议。

- 网友直接缅怀DALL-E,对Greg展示的GPT-4o操作感慨良多。

- 技术飞跃:GPT-4o一次迭代就实现了从破碎文本到风格一致的写作,展示出图像生成的巨大潜力。

?  GPT-4o再秀神操作,“复现”OpenAI总裁讲课,网友当真

?腾讯混元文生图大模型全面开源!

- 业内首个中文原生的 DiT 架构文生图开源模型,支持中英文双语输入及理解,参数量 15 亿。

- Sora同架构,更懂中文,可免费商用。

官网地址:https://dit.hunyuan.tencent.com/

GitHub 项目地址:https://github.com/Tencent/HunyuanDiT

Hugging Face 模型地址:https://huggingface.co/Tencent-Hunyuan/HunyuanDiT

技术报告地址:https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf

? 腾讯混元文生图大模型开源,采用首个中文原生Sora同款DiT架构 

图片

?Google推出开源视觉语言模型:PaliGemma

- 支持图像和短视频字幕、视觉问答、图像文本理解、物体检测文件图表解读、图像分割等任务。

- PaliGemma 模型包含 30 亿(3B)个参数,结合了 SigLiP 视觉编码器和 Gemma 语言模型。

- SigLiP 负责处理图像输入,Gemma 负责处理文本输入和生成输出。 

? https://blink.csdn.net/details/1701958

?小米AI大模型MiLM通过备案 将应用于手机、汽车产品中

- 小米大语言模型MiLM正式通过大模型备案,将应用于小米汽车、手机、智能家居等产品中。

- 北京市生成式人工智能服务新增已备案信息正式公布,19家企业新增备案,“小米”名列其中。

- 小米发布了大规模预训练语言模型MiLM-6B,参数规模为64亿,在 C-Eval 和 CMMLU 上取得同尺寸最好的效果

?Deep Paint:一款可以直接在3D空间中绘画的插件

- 3D空间绘画: 用户可以在三维空间中自由绘画,创造出独特的艺术效果。

- 特制笔刷: 提供多种笔刷工具,模拟传统绘画技巧,如喷枪、毛笔等。

- 材质效果: 包含多种材质,模拟水彩、粉彩等不同的绘画效果,增加模型的艺术质感。

? https://gakutada.gumroad.com/l/DeepPaint

图片


点击全文阅读


本文链接:http://zhangshiyu.com/post/113537.html

<< 上一篇 下一篇 >>

  • 评论(0)
  • 赞助本站

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

关于我们 | 我要投稿 | 免责申明

Copyright © 2020-2022 ZhangShiYu.com Rights Reserved.豫ICP备2022013469号-1