• Hallo liebe Userinnen und User,

    nach bereits längeren Planungen und Vorbereitungen sind wir nun von vBulletin auf Xenforo umgestiegen. Die Umstellung musste leider aufgrund der Serverprobleme der letzten Tage notgedrungen vorverlegt werden. Das neue Forum ist soweit voll funktionsfähig, allerdings sind noch nicht alle der gewohnten Funktionen vorhanden. Nach Möglichkeit werden wir sie in den nächsten Wochen nachrüsten. Dafür sollte es nun einige der Probleme lösen, die wir in den letzten Tagen, Wochen und Monaten hatten. Auch der Server ist nun potenter als bei unserem alten Hoster, wodurch wir nun langfristig den Tank mit Bytes vollgetankt haben.

    Anfangs mag die neue Boardsoftware etwas ungewohnt sein, aber man findet sich recht schnell ein. Wir wissen, dass ihr alle Gewohnheitstiere seid, aber gebt dem neuen Board eine Chance.
    Sollte etwas der neuen oder auch gewohnten Funktionen unklar sein, könnt ihr den "Wo issn da der Button zu"-Thread im Feedback nutzen. Bugs meldet ihr bitte im Bugtracker, es wird sicher welche geben die uns noch nicht aufgefallen sind. Ich werde das dann versuchen, halbwegs im Startbeitrag übersichtlich zu halten, was an Arbeit noch aussteht.

    Neu ist, dass die Boardsoftware deutlich besser für Mobiltelefone und diverse Endgeräte geeignet ist und nun auch im mobilen Style alle Funktionen verfügbar sind. Am Desktop findet ihr oben rechts sowohl den Umschalter zwischen hellem und dunklem Style. Am Handy ist der Hell-/Dunkelschalter am Ende der Seite. Damit sollte zukünftig jeder sein Board so konfigurieren können, wie es ihm am liebsten ist.


    Die restlichen Funktionen sollten eigentlich soweit wie gewohnt funktionieren. Einfach mal ein wenig damit spielen oder bei Unklarheiten im Thread nachfragen. Viel Spaß im ngb 2.0.

Analyse von Google Suchergebnissen? [erledigt]


Registriert
10 Jan. 2018
Beiträge
34
Hallo zusammen,

ich nutze Google ab und zu ganz gerne zu Beantwortungen von Fragen wie:
  • Wie oft haben Websites der britischen Regierung im Januar 2013 etwas über Klimawandel veröffentlicht? [KLICK]
  • Gibt es Artikel der Süddeutschen Zeitung aus dem Jahr 2009 über Mauretanien? [KLICK]
Das eignet sich für einen groben Überblick erstaunlich gut; für die tiefere Beantwortung jener Fragen muss man sich dann jedes Ergebnis nochmal einzeln ansehen; Teaser für weiteren Content unter Artikeln bspw. missversteht Google bei einigen Websites oft falsch.

Meine Frage ist eigentlich recht simpel: gibt es ein Skript, Onlinetool, wasauchimmer, dass mir die obigen Suchanfragen automatisch ein bisschen analysiert und mir so Werte ausgibt wie Suchergebnisse, Ergebnisse nach Monat/anderer Zeiteinheit, ...

Ich hab erstaunlicherweise diesbzgl. nichts finden können und auch beim Formulieren des Threadtitels ein bisschen meine Probleme; eigentlich gibt de rnicht unbedingt das wieder was ich fragen will. Wer also weiß, wie ich den Threadtitel verbessern kann und oder gleich sofort eine Antwort auf meine Frage(n) hat, dem reiche ich schon im Vorraus eine :coffee:.

Lieben Gruß - ESOM.
 
Zuletzt bearbeitet:

Cybergreek

Boardgrieche

Registriert
21 Nov. 2017
Beiträge
365
Re: Analyse von Google Suchergebnissen?

Deine Schlagwörter wären Tools für SEO bzw. SERP.

Hier habe ich gerade eine interessante Lösung gefunden, für die eine Google Tabelle ausreicht:
https://seothing.co.uk/blog/bulk-check-google-results-count

Die Einschränkung auf eine bestimmte Zeit müsstest Du noch einbauen, aber die ist auch nur ein Parameter in der url (&tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2013%2Ccd_max%3A1%2F31%2F2013).
 

Registriert
10 Jan. 2018
Beiträge
34
  • Thread Starter Thread Starter
  • #3
Re: Analyse von Google Suchergebnissen?

Ui, das sieht ja richtig richtig geil aus, Danke sehr!

Leider aber scheint das Skript nicht wirklich zu funktionieren. Ich habe das seit dem du's heir reingepostet hast, immer mal wieder mit mehreren Googledomains getestet; es bleibt dabei, dass offensichtlich Google die Suchanfragen von GoogleDocs blockiert. Das Problem wird auch bereits in den Kommentaren zu dem Blogbeitrag diskutiert: https://seothing.co.uk/blog/bulk-check-google-results-count#comment-613.

Kann man dieses Skript, dass GoogleDocs dort ausführt auch irgendwie anders ausführen? Oder den Ursprung aus GoogleDocs derartig verschleiern, dass die Suchmaschine das nicht mitbekommt und bei der Anfrage davon ausgeht, es sei ein Browser?

Lieben Gruß - ESOM.
 

Registriert
10 Jan. 2018
Beiträge
34
  • Thread Starter Thread Starter
  • #4
Re: Analyse von Google Suchergebnissen?

Inzwischen habe ich es aufgegeben, das Ganze mit diesem Skript zu versuchen.

https://github.com/NikolaiT/GoogleScraper hingegen funktioniert sehr sehr gut. Das ist etwas komplizierter einzurichten, die gelieferten Daten dürften aber ohnehin umfangreicher sein.
 
Zuletzt bearbeitet:

Registriert
10 Jan. 2018
Beiträge
34
  • Thread Starter Thread Starter
  • #6
Re: Analyse von Google Suchergebnissen?

@Cybergreek: Doch, tatsächlich besteht dort auch die Gefahr von Google zeitweise gebannt zu werden; dann gibt dir das Skript nur noch [kw]Malicious Request Detected[/kw] aus. Dennoch ist das schon viiiiel näher am Ziel als das von dir eingangs vorgeschlagene Scraper-Skript über GoogleDocs, weil man tatsächlich mal schöne ordentliche Ergebnisse in einem JSON hat :beer:.

Es besteht allerdings ein Proxysupport:
Provides proxy support using socksipy and built in browser proxies:
Socks5
Socks4
HttpProxy
Da allerdings besteht dann wiederum das Problem, dass es quasi keine guten freien Proxies gibt, die einen nicht auch nach wenigen Requests schon sperren (oder sind welche bekannt, die für so etwas gut wären :)?)

Als Workaround habe ich mit meinem Smartphone einen Hotspot eingerichtet, habe das Skript über die neue IP laufen lassen, mich sperren lassen, mobile Datenverbindung kurzzeitig ausgeschaltet, neue IP erhalten und konnte weiter scrapen ;) :).
 

theSplit

1998
Veteran Barkeeper

Registriert
3 Aug. 2014
Beiträge
28.573
Google, hat aber auch, bei "expliziten" (bzw. mehreren) Suchanfragen gerne eine Captcha-Seite eingebaut, zum Beispiel wenn Suchmaschinen-Parameter verwendet werden. Daran könnte so ein Skriptaufruf auch "scheitern". Falls darauf nicht geprüft wird, das Skript ist ja schon 2 Jahre alt.
 

Registriert
10 Jan. 2018
Beiträge
34
  • Thread Starter Thread Starter
  • #8
@theSplit: Danke, dass du das erwähnst! Ich hab das gerade nochmal nachgecheckt - das war bei mir aber nicht der Fall. Ich hatte zwar jene von dir angesprochenen "expliziten" Suchanfragen (Zeitraumbegrenzung, Seitenbeschränkung) - dennoch wurden alle Suchergebnisse korrekt in die JSON-Dateien eingetragen; wenn das Skript anfangs n Suchergebnisse hat finden können, waren auch immer n Einträge in der JSON :).

Ansonsten bestünde noch der Captcha-Modus in dem Skript: https://github.com/NikolaiT/GoogleS...59b8daf2648765/GoogleScraper/scrape_config.py (Zeile 250ff), der allerdings nur eine manuelle Option anbietet.

https://github.com/thibauts/node-google-search-scraper bietet tatsächlich deathbycaptcha.com-Support an - da fand ich allerdings den Output des Skripts nicht so schön wie dem eingangs von mir empfohlenem ;).
 

theSplit

1998
Veteran Barkeeper

Registriert
3 Aug. 2014
Beiträge
28.573
@Eternal Sun of Mankind: Okay, wundert mich ein wenig... :)

Aber du solltest auch beachten:

Manual captcha solving
# If this parameter is set to a Integer, the browser waits for the user
# to enter the captcha manually whenever Google detected the script as malicious.

# Set to False to disable.
# If the captcha isn't solved in the specified time interval, the browser instance
# with the current proxy is discarded.

Was so viel heißt wie, wenn du keine Captchas manuell eingibst, wird die "Sitzung" / Instanz verworfen, daher, du würdest Daten verlieren.
Wäre in deinem Fall ja nicht so toll ;)
 
Oben