这是一个允许你从多个来源收集电影剧本的工具,并以.txt文件的形式创建一个包含2.5千多部电影剧本的数据库,同时还有电影的元数据。

整个过程有四个步骤:
从各种来源收集剧本 - 在网站上搜刮HTML、txt、doc或pdf格式的剧本
收集元数据 - 从TMDb和IMDb获取关于剧本的元数据,以便进行额外处理
查找不同来源的重复内容 - 自动分组并删除不同来源的重复内容。
解析脚本 - 将脚本转换为只含人物和对话的行文

The Movie Script Database | #工具 #剧本
 
 
Back to Top