小红花·文摘 - 小红花技术领袖俱乐部

FastStone Capture是一款强大的截图和录像工具，支持多种捕获方式和基本图像编辑功能，适合文档制作和教学视频，提高工作效率。

FastStone Capture – 一款经典优秀屏幕截图录像工具

老董日志 ·

给大模型制作图文并茂的教科书: 从2.5年的教学视频里挖掘多模态语料

给大模型制作图文并茂的教科书: 从2.5年的教学视频里挖掘多模态语料

机器之心 ·

如何写好提示词？

如何写好提示词？

宝玉的分享 ·

本文探讨了在教学视频中处理多任务动作类型的决策空间的挑战。研究者通过引入掩蔽扩散模型和视觉表示学习技术，提高了任务分类的准确性，并在多个数据集上验证了其性能。该方法有效整合了生成建模与去噪过程，推动了视频理解和生成任务的发展。

ActionDiffusion: 一个针对教学视频程序规划的动作感知扩散模型

BriefGPT - AI 论文速递 ·

该文介绍了一种处理教学视频中多个动作类型的决策空间的方法，即掩蔽扩散模型。该方法使用面向任务的注意力过滤器来集中扩散/去噪过程在一部分动作类型上，同时采用联合视觉-文本嵌入来增强任务分类的准确性。

面具扩散 + 任务感知：教学视频中的程序规划

BriefGPT - AI 论文速递 ·