1.大模型也有小偷？为保护你的参数，上交大给大模型制作「人类可读指纹」

1）预训练模型的参数，尤其是千亿级别模型的参数，通常不会开源。

2）更重要的是，预训练模型的输出和参数都会随着 SFT、RLHF、continue pretraining 等下游处理步骤而变化。这使得无论是基于模型输出还是基于模型参数，都很难判断某一模型是否是基于另一现有模型微调得来。

因此，对大模型参数的保护是一个尚缺乏有效解决方案的全新问题。

2.阿里全新Agent玩转手机：刷短视频自主点赞评论，还学会了跨应用操作

会操纵手机的智能体，又迎来了全新升级！

新的Agent打破了APP的界限，能够跨应用完成任务，成为了真·超级手机助手。

比如根据指示，它可以自行搜索篮球比赛的结果，然后根据赛况在备忘录中撰写文稿。

来自阿里的一篇最新论文，展示了全新手机操纵智能体框架Mobile-Agent，可以玩转10款应用，还能跨越APP完成用户交给的任务，而且即插即用无需训练。

依托多模态大模型，整个操纵过程完全基于视觉能力实现，不再需要给APP编写XML操作文档。

3.2023 年是 AI 视频元年，2024 年还有这些难题需要解决

这是 A16Z 合伙人 Justine Moore 最新发布的 2024 年 AI 视频展望。Justine 提到，2023 年对于 AI 视频领域来说，是突破性的一年。

2023 年初时，公开的文本转视频模型尚不存在。仅仅 12 个月后，数十种视频生成产品已被积极使用，全球有数百万用户通过文本或图像提示创建短片。

这些产品仍然有相对的局限性——大多数生成的视频时长为 3～4 秒，输出的质量参差不齐，像角色一致性这样的问题还未得到解决。我们距离用单一文本提示（或甚至多个提示！）创造出皮克斯级别的短片还有很长的路要走。

4.比肩GPT-4，商汤日日新大幅升级4.0，多模态能力领先一步

商汤一下子把多模态大模型的发展进度条，快进到了落地阶段。

商汤的大模型体系「日日新 SenseNova」今天刚刚发布了 4.0 版，不论语言能力还是文生图能力都有全面升级，还自带低门槛的落地工具。

新一代 SenseNova 不仅在大语言模型、文生图模型等方面进行了重大升级，部分垂直领域能力超越 GPT-4，还发布了全新多模态大模型，并面向数据分析、医疗等场景提供了全新版本，让大模型通用能力适配到了更多领域。

5.惊！1元竟能驱动170万次AI推理？面壁智能MiniCPM 2B大模型：颠覆你的想象，让老手机秒变AI神器！

在科技日新月异的今天，我们似乎习惯了“更新换代”的节奏。但你有没有想过，那些陪伴我们多年的老手机，也能摇身一变成为AI神器？面壁智能的MiniCPM 2B大模型，就给我们带来了这样的惊喜。

你可能不知道，这个仅有20亿参数的大模型，却拥有“越级打怪”的实力。与业内知名的大模型相比，它在多项主流评测中都展现出了优越的性能。更令人振奋的是，它的成本极低，仅需1元就能驱动170万次AI推理！

6.更新后的GPT-3.5 Turbo上线，降低50%的输入定价

7.如何借助AI生成红包封面

Provide feedback

Saved searches