Freebase是个类似wikipedia的创作共享类网站,所有内容都由用户添加,采用创意共用许可证,可以自由引用。两者之间最大的不同在于,Freebase中的条目都采用结构化数据的形式,而wikipedia不是。这一套格式是固定的,所有人物条目都包含同样的字段。这样一来,数据之间就可以很容易地联系在一起,为信息的查询和处理提供了巨大的方便。推而广之,Freebase的目标是包含地球上的所有信息,因此可以设想,理论上,将来可以从freebase中得到任何信息。我立刻能想到的一个应用是,将来在电脑上播放DVD或mp3时,播放器可以到Freebase中获取光盘或专辑的出版信息。这件事情最难的地方,倒还不是收集地球上的所有信息,而是怎样确定数据结构,换言之,怎样用一种格式描述出所有信息。
freebase的结构分为哪些?
Freebase的结构分为三层:Domain -> Type -> Topic。
1) 在Freebase中,每个条目叫做一个Topic,每个Topic中的固定字段,叫做“属性”(Property);
2) 所有同类的Topic组成一个Type,比如所有电影Topic就属于同一个Type,每个Type都有一套固定的Property,因此同类信息可以直接比较和关联;
3) 所有相关的Type组成一个“域”(Domain),比如电影和音乐都属于“艺术和娱乐“ Domain。
截至2007年5月30日,Freebase中共有61个DOMAIN、765个Type,2,312,676个Topic。