什么是Lilac?

丁香是一个开源工具,通过改善数据来改善产品的数据和AI从业者的工具。

收录于 2024-02-03

提供 Website. 超过5.367K月访问量。

如何使用 Lilac?

要使用丁香,您可以通过pip install lilac进行安装。安装完成后,您可以使用Python界面或命令行界面搜索、量化、编辑和比较数据字段。丁香还提供了聚类、语义和关键字搜索、模糊概念搜索以及检测PII、重复项、语言或自定义信号等功能。

Lilac 的核心功能 ?

搜索、量化和编辑LLMs的数据
AI聚类
语义和关键字搜索
编辑和比较字段
PII、重复项、语言检测或自定义信号
具有修正功能的模糊概念搜索

Lilac 的使用案例

#1 数据探索和质量控制
#2 选择适合任务的正确数据