黑洞资源笔记
07:25 · Mar 30, 2023 · Thu
这是一个允许你从多个来源收集电影剧本的工具,并以.txt文件的形式创建一个包含2.5千多部电影剧本的数据库,同时还有电影的元数据。
整个过程有四个步骤:
从各种来源收集剧本 - 在网站上搜刮HTML、txt、doc或pdf格式的剧本
收集元数据 - 从TMDb和IMDb获取关于剧本的元数据,以便进行额外处理
查找不同来源的重复内容 - 自动分组并删除不同来源的重复内容。
解析脚本 - 将脚本转换为只含人物和对话的行文
The Movie Script Database
| #工具 #剧本
Home