作为一个喜欢收集影视资源的人,笔者面临的一个任务是:从文件名中解析出格式化的媒体信息(信息源统一为[The Movie Database (TMDB)]( https://www.themoviedb.org/?language=zh-CN)),方便整理文件,如:

| 文件名                                                       | 格式化信息                                                   |
| ------------------------------------------------------------ | ------------------------------------------------------------ |
| Young.Woman.and.the.Sea.2024.2160p.DSNP.WEB-DL.H265.HDR.DDP5.1.Atmos-ADWeb.mkv | `{'title': '泳者之心', 'genre': 'movie', 'year': 2024}`      |
|  [動畫瘋] 物語系列 第外季&第怪季\[9\]\[1080P\].mp4          | `{'title': '物语系列', 'genre': 'tv(anime)', 'year': 2009, 'tv_season_num': 5, 'tv_episode': 9}` |

那么,在给定文件名的情况下,怎么用大语言模型( LLM ,以下简称大模型) + TMDB API 来完成媒体信息的解析工作呢?这篇文章应运而生。

> 当然,解析媒体信息 + 整理媒体文件(或者说媒体文件刮削),已经有很多现成的解决方案,如`nas-tools`、`jellyfin`,笔者更多是想探索大模型的可能性。

---

"太长不看"的总结:
- qwen-plus-latest (qwen 2.5) 强于 deepseek-chat (v2.5),gpt-4o-mini/gemini-1.5-flash 落后
- Tools(Function Calling)在机器间交互不好用,笔者的 JSON 调用模式效率&效果更优。


----
原文链接:[大模型 Tools(Function Calling)实用性分析 - 以媒体信息解析为例 - OrangeWolf 的博客]( https://www.yooo.ltd/2024/09/21/parcticality-analysis-of-llm-tools/)
举报· 49 次点击
登录 注册 站外分享
3 条回复  
anonydmer 小成 2024-9-21 12:22:59
看了原文,挺好的,楼主可以再加个 kimi 的测试一下,它有一个原生 JSON Mode 的功能
TimePPT 小成 2024-9-21 13:30:09
实体抽取输出 json 现在 gpt4o 有 json schema 模式
neteroster 小成 2024-9-21 13:36:49
4o mini 也可以传 json schema
返回顶部