• Hallo liebe Userinnen und User,

    nach bereits längeren Planungen und Vorbereitungen sind wir nun von vBulletin auf Xenforo umgestiegen. Die Umstellung musste leider aufgrund der Serverprobleme der letzten Tage notgedrungen vorverlegt werden. Das neue Forum ist soweit voll funktionsfähig, allerdings sind noch nicht alle der gewohnten Funktionen vorhanden. Nach Möglichkeit werden wir sie in den nächsten Wochen nachrüsten. Dafür sollte es nun einige der Probleme lösen, die wir in den letzten Tagen, Wochen und Monaten hatten. Auch der Server ist nun potenter als bei unserem alten Hoster, wodurch wir nun langfristig den Tank mit Bytes vollgetankt haben.

    Anfangs mag die neue Boardsoftware etwas ungewohnt sein, aber man findet sich recht schnell ein. Wir wissen, dass ihr alle Gewohnheitstiere seid, aber gebt dem neuen Board eine Chance.
    Sollte etwas der neuen oder auch gewohnten Funktionen unklar sein, könnt ihr den "Wo issn da der Button zu"-Thread im Feedback nutzen. Bugs meldet ihr bitte im Bugtracker, es wird sicher welche geben die uns noch nicht aufgefallen sind. Ich werde das dann versuchen, halbwegs im Startbeitrag übersichtlich zu halten, was an Arbeit noch aussteht.

    Neu ist, dass die Boardsoftware deutlich besser für Mobiltelefone und diverse Endgeräte geeignet ist und nun auch im mobilen Style alle Funktionen verfügbar sind. Am Desktop findet ihr oben rechts sowohl den Umschalter zwischen hellem und dunklem Style. Am Handy ist der Hell-/Dunkelschalter am Ende der Seite. Damit sollte zukünftig jeder sein Board so konfigurieren können, wie es ihm am liebsten ist.


    Die restlichen Funktionen sollten eigentlich soweit wie gewohnt funktionieren. Einfach mal ein wenig damit spielen oder bei Unklarheiten im Thread nachfragen. Viel Spaß im ngb 2.0.

Javascript - wie genau läuft dieser Request ab? (Bild von Firebug)

Commodo

NGBler

Registriert
17 Mai 2014
Beiträge
151
Ich habe einen Crawler in GO geschrieben, der auch soweit super läuft.

Allerdings möchte ich jede Seite auf einen bestimmten Request hin überprüfen, da auf jeder Seite ein eingebundenes Javascript läuft/laufen sollte (wenn keins da ist kommt das auch mit in die CSV-Datei am Ende), welches diesen Request sendet.

Bild: http://postimg.org/image/ozw6y3mjb/full/

Problem 1: Ich weiss nicht genau, wie dieser Request abläuft, meinen beschränkten Webkenntnissen nach lädt mein Browser die Seite, rendert sie und führt das Script aus, welches dann den Request an den pi.aspx-Server sendet?
Also feuert mein Browser diesen Request quasi ab?

Problem 2: Wie könnte ich dieses JSON-Objekt und die Campaign-ID (es ändern sich je nach Seite oft Werte) beim Seitenaufruf bekommen?
Headless-Browser wäre wohl eine Möglichkeit, mein Crawler hat 6Mb, PhantomJS hat 46Mb und ich müsste ihn mit Javascript programmieren was ich nicht kann und ich weiss nicht wonach ich googlen müsste für Infos (siehe Problem 3) :(

Problem 3: Wonach müsste ich googlen? GET Request bringt mir URL Parameter filtern und POST Requests auslesen, aber nicht das was ich brauche :confused:-

Mit besten Grüßen ins Wochenende :beer:.
 

Jester

★★★★☆ (Kasparski)

Registriert
1 Dez. 2014
Beiträge
6.066
Ort
Code Azure
Hey,

1. Jap.
2./3. Boah, da bin ich etwas überfragt. Der gefeuerte Request dürfte ein XMLHttpRequest sein, dessen Objekt man durchaus per addEventListener ein Event-Handling verpassen kann. Sollte ich damit falsch liegen, kannst Du aber nach diesen Stichworten suchen.

Gruß,

J.
 

Kugelfisch

Nerd

Registriert
12 Juli 2013
Beiträge
2.342
Ort
Im Ozean
Problem 2: Wie könnte ich dieses JSON-Objekt und die Campaign-ID (es ändern sich je nach Seite oft Werte) beim Seitenaufruf bekommen?
Das lässt sich so allgemein nicht beantworten, bzw. die einzige allgemeine Lösung ist die Verwendung eines (Headless-)Browsers. Mutmasslich finden sich die Informationen jedoch entweder im extern eingebundenen JavaScript selbst, oder aber in einem script-Element auf der Seite. In beiden Fällen könntest du z.B. reguläre Ausdrücke verwenden, um die Informationen aus dem JavaScript-Quelltext zu parsen.
 

Commodo

NGBler

Registriert
17 Mai 2014
Beiträge
151
  • Thread Starter Thread Starter
  • #4
Mutmasslich finden sich die Informationen jedoch entweder im extern eingebundenen JavaScript selbst, oder aber in einem script-Element auf der Seite. In beiden Fällen könntest du z.B. reguläre Ausdrücke verwenden, um die Informationen aus dem JavaScript-Quelltext zu parsen.
Das ist leider nicht der Fall, ich hab grade das Script mal untersucht, da fehlen fast alle Werte :(.

Im Quelltext stehen die Sachen manchmal, aber nicht immer und die Anzahl an Variablen/Werten ändert sich auch, der einzig sichere Weg an diese Informationen zu kommen ist leider der GET Request.

Beispielsweise sieht ein Request so aus (etwas gekürzt):
Code:
https://m.XXXXX.de/pi.aspx?campaign=26113a&pitype=Content&convtype=&items=%7B%22type%22%3A%22Content%22%2C%22conversiontype%22%3A%22%22%2C%22referrer%22%3A%22%22%2C%22host%22%3A%22www.hghghg.de

Ein Headless-Browser würde meinen Crawler von 6Mb auf 52Mb aufblähen mit PhantomJS und ich müsste ihn in Javascript programmieren, wovor es mir ziemlich graust da ich von JS absolut 0 Ahnung habe. Aber anscheinend komm ich da nicht drum rum :(.
 
Oben