Distributed Deployment Architecture
可将数据分散的存储于多台独立的机器设备上,采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,以利用位置服务器定位存储信息利用位置服务器定位存储信息Automatic Segmentation
系统通过基于分词库的字符串匹配分词方法以及统计分词等方法,能够极大的提升数据检索的效率和准确度,数据智能化匹配。Full-Text Retrieval
可将数据分散的存储于多台独立的机器设备上,采用可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,以解决传统集中式存储系统的瓶颈问题,提高系统的可靠性、可用性和扩展性。Similarity Match
独创的相似度比对算法,采用余弦定理计算数据相似度匹配,通过预设数据权重,智能化推荐匹配数据。Self-Defined Matching Rules
用户可自行定义数据匹配的规则,如“学名=俗称”匹配规则以及推荐数据的相似匹配度范围,更加符合用户数据清洗的实际需求,灵活性更高。