RuiJi Scraper 选择器
如之前课程所述,选择器首先是用来描述出需选择的数据块Block、数据片Tile或元数据Meta所在的区域,在RuiJi Scraper中,必须以Css选择器为开始。
在描述出需选择的区域之后,可以根据需要对选择出的区域的源代码进行下一步的清洗,整理。所以在RuiJi Scraper中选择器为一个数组。通常第一个选择器用来选择区域,之后的选择器用做清洗,整理数据之用。从第二个选择器开始,选择器的输入是上一个选择器的输出。
在RuiJi Scraper中提供了多种选择器,如果您对数据的精细度没有太大要求的话,只使用一个选择器就可以,如果您希望提取出的数据更加精确,更满足业务需要,您可以使用更多的选择器来达到您的目的。
RuiJi Scraper的选择器与RuiJi.Net的选择器一样,具有如下类型: