Водич за Цхроме Веб Сцрапер од Семалт Екперт-а

Ако користите Гоогле Цхроме, постоји прегледач за ваш прегледач који може помоћи у брисању веб страница. Познат је као "Сцраппер" и може се користити без проблема. Сцраппер ће вам помоћи при брисању садржаја на веб локацији и отпремању резултата у Гоогле документе.

Како да грешкате веб локацију помоћу проширења Сцрапер?

1. Изаберите Цхроме веб продавницу у Гоогле Цхроме-у;

2. У проширењима потражите „Сцраппер“;

3. Први резултат претраге је проширење познато као '' Сцраппер '';

4. Изаберите дугме наведено као „„ Додај у Цхроме “;

5. Вратите се на листу заступника у Великој Британији;

6. Кликните на следећу везу ;

7. Сада потражите једног МП и осигурајте да је унос означен;

8. Десном типком миша одаберите опцију "Сцрапе симилар ...";

9. Конзола за сцраппер ће се појавити у другом прозору;

10. Погледајте исклесани садржај на конзоли стругача;

11. Да бисте осигурали да се садржај сачува као Гоогле табела, изаберите „Сачувај у Гоогле документима ...“

Продужено стругање

Пре него што се придржавате овог рецепта, корисно је разумети основе ХТМЛ-а. На пример, преко ове везе можете да прочитате кратак увод у ХТМЛ

Замислимо да нас занимају сви филмови у којима је глумила Асиа Аргенто, позната италијанска глумица.

1. Постоји веома детаљна архива актера у ИМДБ-у. Азија Аргенто сајт је: хттп://ввв.имдб.цом/наме/нм0000782/;

2. Овде можете видети све улоге које глумица игра. Почнимо с брисањем информација које нас занимају;

3. Покушајте да га стружете онако како је горе описано;

4. Видећете да је листа мало искривљена. То је због чињенице да се листа овде може различито структуирати;

5. Идите до конзоле стругача. Горње лево видећете малу кутију на којој пише КСПатх;

6. Кспатх је врста упита за језик који ради за КСМЛ и ХТМЛ;

7. КСПатх вам може помоћи да пронађете делове странице који вас занимају. Следећа ствар је пронаћи одговарајући елемент и написати КСПатх за то;

8. аранжирајмо наш сто;

9. Видећете да је наш постојећи КСПатх, који има све потребне податке, "// див [3] / див [3] / див [2] / див";

10. КСПатх обавештава систем да прегледа ХТМЛ документ и изабере трећи елемент, затим други елемент и затим све њих;

11. Али, желели бисмо да се наши подаци раздвоје;

12. Употријебите одјељак ступаца на конзоли за скраппер да бисте то постигли;

13. Хајде да прво пронађемо свој наслов РІР‚њњ Користите Инспецт Елемент за преглед наслова;

14. Проверите наслов унутар ознаке. Додајте ознаку у КСПатх;

15. Чини се да израз дјелује на одговарајући начин, тако да то буде наша прва колона;

16. У одељку "Ступци" замените име прве колоне на "наслов";

17. Додајте му КСПатх;

18. У одељку ступца КСПатхс су релативни и значи да ће "./б" одабрати <б> елемент

19. У КСПатх за насловну колону додајте „./б“ и изаберите „сцрапе“;

20. Сада идемо даље годину дана. Године се могу наћи унутар једног распона;

21. Креирајте нову колону одабиром малог плуса поред колоне за ваш наслов;

22. Помоћу КСПатх „./спан“ креирајте колону за „годину“;

23. Кликните гребање и погледајте како је година додата;

24. Готово!