• Hallo liebe Userinnen und User,

    nach bereits längeren Planungen und Vorbereitungen sind wir nun von vBulletin auf Xenforo umgestiegen. Die Umstellung musste leider aufgrund der Serverprobleme der letzten Tage notgedrungen vorverlegt werden. Das neue Forum ist soweit voll funktionsfähig, allerdings sind noch nicht alle der gewohnten Funktionen vorhanden. Nach Möglichkeit werden wir sie in den nächsten Wochen nachrüsten. Dafür sollte es nun einige der Probleme lösen, die wir in den letzten Tagen, Wochen und Monaten hatten. Auch der Server ist nun potenter als bei unserem alten Hoster, wodurch wir nun langfristig den Tank mit Bytes vollgetankt haben.

    Anfangs mag die neue Boardsoftware etwas ungewohnt sein, aber man findet sich recht schnell ein. Wir wissen, dass ihr alle Gewohnheitstiere seid, aber gebt dem neuen Board eine Chance.
    Sollte etwas der neuen oder auch gewohnten Funktionen unklar sein, könnt ihr den "Wo issn da der Button zu"-Thread im Feedback nutzen. Bugs meldet ihr bitte im Bugtracker, es wird sicher welche geben die uns noch nicht aufgefallen sind. Ich werde das dann versuchen, halbwegs im Startbeitrag übersichtlich zu halten, was an Arbeit noch aussteht.

    Neu ist, dass die Boardsoftware deutlich besser für Mobiltelefone und diverse Endgeräte geeignet ist und nun auch im mobilen Style alle Funktionen verfügbar sind. Am Desktop findet ihr oben rechts sowohl den Umschalter zwischen hellem und dunklem Style. Am Handy ist der Hell-/Dunkelschalter am Ende der Seite. Damit sollte zukünftig jeder sein Board so konfigurieren können, wie es ihm am liebsten ist.


    Die restlichen Funktionen sollten eigentlich soweit wie gewohnt funktionieren. Einfach mal ein wenig damit spielen oder bei Unklarheiten im Thread nachfragen. Viel Spaß im ngb 2.0.

[Archlinux] Grafikprobleme nach Kernel-Update

kpj

NGBler

Registriert
27 Juli 2014
Beiträge
98
Moin,
ich nutze Archlinux x86_64 und hatte neulich meinen Kernel von 3.15.5-1 auf 3.15.5-2 geupdatet. Hier ist es eventuell auch wichtig zu erwähnen, dass ich keines meiner nvidia-, mesa-, etc. Pakete geupdatet hatte (mein nvidia ist in der Version 340.24-1).
Nach einiger Zeit stürzte mein Rechner dann plötzlich mit komischen Artefakten auf dem Monitor ab und mir blieb nichts anderes übrig, als neuzustarten. Beim Neustarten kam ich dann bis zu dem Punkt wo, der Loginmanager gestartet wird (bei mir slim), und damit auch X, etc (schätze ich).
Bevor dieser jedoch gestartet wurden konnte wurde mein Bildschirm plötzlich schwarz und Schrift tauchte auch, welche irgendetwas mit 'NVRM' und 'Xid' enthielt. Diese Schrift wurde jedoch schnell wieder von tiefem schwarz überdeckt, welches es mir unmöglich machte ihren genauen Wortlaut zu erfahren.
Nach einiger Zeit habe ich dann wieder versucht den Rechner neuzustarten und siehe da, es ging ohne Probleme. Daraufhin habe ich dann schnell meinen Kernel wieder auf 3.15.5-1 downgegradet.
Leider ließen sich die Probleme dadurch nicht beheben. Mein Rechner stürzt trotzdem immer wieder mit grafischen Artefakten ab. Interessant dabei ist, dass ich manchmal direkt komplett neustarten muss, manchmal der Sound noch weiterspielt und ich meine Maus noch bewegen kann aber keine Fenster mehr nutzen kann. Ich manchen Fällen bleibt mir dann nur übrig neuzustarten. In anderen Fällen kann ich nach kurzen Warten den Rechner plötzlich einfach weiterbenutzen. Zudem konnte ich ein paar Log-Messages finden, die eventuell etwas damit zu tun haben:
[src=bash]kernel: NVRM: GPU at PCI:0000:02:00: GPU-89952c1a-0f7a-32fa-15fd-053b999bb7d1
kernel: NVRM: Xid (PCI:0000:02:00): 13, Graphics Exception: ChID 0004, Class 00008297, Offset 000017b4, Data 00000001
kernel: NVRM: Xid (PCI:0000:02:00): 13, Graphics Exception: ChID 0003, Class 00008297, Offset 000017b4, Data 00000001
kernel: chromium[13588]: segfault at 0 ip 00007fcacaf3d876 sp 00007fff8a941a60 error 4 in libnvidia-glcore.so.340.24[7fcac97a7000+19c1000]
kernel: NVRM: Xid (PCI:0000:02:00): 6, PE0003
kernel: NVRM: Xid (PCI:0000:02:00): 69, Class Error: ChId 0003, Class 00008297, Offset 00000fec, Data 00ffa55a, ErrorCode 0000000c
kernel: NVRM: Xid (PCI:0000:02:00): 6, PE0003[/src]
(bei dem chromium Eintrag bin ich mir nicht sicher, es sieht aber schon zugehörig aus).
Nach etwas herumgesuche bin ich dann hierauf gestoßen. Hier wurde ich dann etwas verwirrt. Es werden Kernel-Notifications angesprochen (ich habe diese Einstellung in meiner 'nvidia-settings' App gar nicht gefunden) und mariadb wird erwähnt (ist bei mir zwar installiert, läuft aber nicht). Außerdem scheint es dort eher mit dem downgraden von nvidia zu fixen gewesen zu sein.
Ich hingegen habe nvidia überhaupt nicht geupdatet, und meinen Kernel schon gedowngraded (mkinitcpio etc, wurde dabei schon standartmäßig mit ausgeführt, ich hoffe, dass pacman das richtig hingekriegt hat...) und konnte die Crashes damit nicht vermeiden.

Daher nun meine Frage an euch, irgendjemand irgendeine Idee, was hier passiert?
Vielen Dank für alle Anregungen und gebt bitte Bescheid, sollte ich wichtige Informationen vergessen haben.

Gruß,
kpj
 

Beezle

Mit-Glied

Registriert
15 Juli 2013
Beiträge
472
Dein Grafiktreiber ist gegen die Kernelheader gelinked. Wenn du den Kernel updatest, musst du auch entweder den Grafiktreiber neu übersetzen, oder den alten möglicherweise neu installieren. auf jeden Fall brauchst du vorher IMMER die zum Kernel passenden Header Dateien.

Ich will jetzt gar nicht erst fragen, welchen Grund du hattest den Kernel vom Minor Release -1 auf -2 upzugraden. :unknown:
 

gelöschter Benutzer

Guest

G
nvidia-dkms installieren und freuen.

Eventuell lösen sie demnächst auch das Abhängigkeitsproblem, ansonsten musst du bei Updates nämlich erst mal nvidia-dkms deinstallieren, nvidia-utils upgraden, dann wieder nvidia-dkms aktualisieren. Oder ähnliches.
 

kpj

NGBler

Registriert
27 Juli 2014
Beiträge
98
  • Thread Starter Thread Starter
  • #4
Dein Grafiktreiber ist gegen die Kernelheader gelinked. Wenn du den Kernel updatest, musst du auch entweder den Grafiktreiber neu übersetzen, oder den alten möglicherweise neu installieren. auf jeden Fall brauchst du vorher IMMER die zum Kernel passenden Header Dateien.
Das hieße dann, dass die korrekte Installationsreihenfolge
  1. linux-headers
  2. linux
  3. nvidia
  4. nvidia-utils
  5. lib32-nvidia-utils
wäre?

Ich will jetzt gar nicht erst fragen, welchen Grund du hattest den Kernel vom Minor Release -1 auf -2 upzugraden. :unknown:
Wurde mir von pacman so angeboten :p

nvidia-dkms installieren und freuen.
nvidia-dkms ist dann quasi der Ersatz für das nvidia Paket? nvidia-utils würde es also auch brauchen (steht zumindest hier).

Eventuell lösen sie demnächst auch das Abhängigkeitsproblem, ansonsten musst du bei Updates nämlich erst mal nvidia-dkms deinstallieren, nvidia-utils upgraden, dann wieder nvidia-dkms aktualisieren. Oder ähnliches.
Würde da dies nicht helfen?
 

gelöschter Benutzer

Guest

G
Würde da dies nicht helfen?

Glaube nicht, weil pacman dann immer noch wegen Abhängigkeiten rummeckert. Habe mich da aber auch noch nicht wirklich eingefuchst, ist glaube ich mehr Arbeit da ein perfektes Setup zu haben als die paar Mal im Jahr 20 Zeichen mehr zu tippen.
 

kpj

NGBler

Registriert
27 Juli 2014
Beiträge
98
  • Thread Starter Thread Starter
  • #6
Aber würden die bisherigen Erklärungen nicht auch Bedeuten, dass ich diese Probleme bei jedem Kernel-Update haben müsste? Alle bisherigen Updates gingen ohne Probleme.
 

mathmos

404

Registriert
14 Juli 2013
Beiträge
4.415
Ich will jetzt gar nicht erst fragen, welchen Grund du hattest den Kernel vom Minor Release -1 auf -2 upzugraden. :unknown:

Spontan würde mir einer der goldenen Regeln bei Arch einfallen. Die da sinngemäß lautet, dass man ohne triftigen Grund kein unvollständiges Update ausführt.

@kpj:

Nein bedeutet es nicht zwangläufig. In deinem Fall hast du von Version 3.15.1 auf 3.15.2 aktualisiert. Im PKGBUILD von nvidia z. B. ist die Abhängigkeit aber nur linux>=3.15 bzw. linux-headers>=3.15. Somit es es egal, ob nun 3.15.1 oder 3.15.2 vorhanden ist.

Im Grunde kannst du auch nvidia-dkms bzw. nvidia-hooks verzichten, sofern du die Nvidia-Treiber aus [extra] verwendest. Diese gelten immer für den aktuellen Standard-Kernel der bei Arch angeboten wird (https://bbs.archlinux.de/viewtopic.php?id=20689). Ich nutze z. B. kein DKMS hinsichtlich Nvidia und bei gab es bisher noch nie Probleme bei einem Update was die Grafikkarten-Treiber betrifft.
 

thom53281

SYS64738
Teammitglied

Registriert
14 Juli 2013
Beiträge
6.918
Um mal noch eine ganz abwegige Idee einzubrigen: Könnte es sein, dass ausgerechnet jetzt Deine Grafikkarte gerade zufälligerweise abgeraucht ist? Von welcher Grafikkarte reden wir genau?

Vor allem wenn ein Downgrade auf den alten Kernel keine Abhilfe bringt, sollte man das evtl. vorher noch überprüfen, bevor man sein halbes Setup austauscht. ;)


Grüße
Thomas
 

Asseon

Draic Kin

Registriert
14 Juli 2013
Beiträge
10.353
Ort
Arcadia
Da es sich um ein Distributions spezifisches update handelt, 3.15.5-1 auf 3.15.5-2 kein update der kernel version alles nach dem dash ist disi spezifisch, kann man den Nvidia Treiber durchaus weiter benutzen, wenn er sich noch laden läst, was offensichtlich der fall ist.
Die einzige Änderung war efi stub kram der mit der Grafikkarte rein gar nix zu tun hat.

Daher was thom sagt.
Versuch mal irgendeine Live disi zu starten obs damit vernünftig läuft, alternativ versuchs mal mit dem noveau treiber.
 

kpj

NGBler

Registriert
27 Juli 2014
Beiträge
98
  • Thread Starter Thread Starter
  • #10
Nein bedeutet es nicht zwangläufig. In deinem Fall hast du von Version 3.15.1 auf 3.15.2 aktualisiert. Im PKGBUILD von nvidia z. B. ist die Abhängigkeit aber nur linux>=3.15 bzw. linux-headers>=3.15. Somit es es egal, ob nun 3.15.1 oder 3.15.2 vorhanden ist.
Das heißt also, dass der Grafiktreiber auch einfach so gegen den neuen Kernel gelinked wird?

Um mal noch eine ganz abwegige Idee einzubrigen: Könnte es sein, dass ausgerechnet jetzt Deine Grafikkarte gerade zufälligerweise abgeraucht ist? Von welcher Grafikkarte reden wir genau?
Daran hatte ich auch gedacht, es aber schnell wieder verdrängt, weil das sehr doof wäre...
[src=bash]$ lspci | grep VGA
02:00.0 VGA compatible controller: NVIDIA Corporation G96M [GeForce 9600M GT] (rev a1)[/src]

Versuch mal irgendeine Live disi zu starten obs damit vernünftig läuft
Wäre es dafür nicht praktisch einen Weg herauszufinden, bei dem es immer zum Absturz kommt? Ansonsten ist das als debugging eher schlecht geeignet, oder?

alternativ versuchs mal mit dem noveau treiber
Hehe, seit Jahren versuche ich nach jedem nouveau Update diesen Treiber zu installieren, jedes mal ist es damit nichtmal möglich mich einzuloggen, weil es schon davor zur kernel panic kommt. Diese Idee werde ich daher eher nicht verwerten können^^
 

mathmos

404

Registriert
14 Juli 2013
Beiträge
4.415
Das heißt also, dass der Grafiktreiber auch einfach so gegen den neuen Kernel gelinked wird?

In der Regel erfolgt bei einem Updates des Kernels auch ein Update der Nvidia-Treiber in [extra]. Nehmen wir mal als Beispiel Version 3.15. Dessen Paket wurde am 08.06.14 erstellt.

Am gleichen Tag gab es beim Nvidia-Treiber ein Update. Hierbei wurde nur die benötigte Kernel- und Headerversion entsprechend an den neuen Kernel angepasst und somit die Module für den neuen Kernel erstellt.

Das gleiche Spiel wird es dann wieder bei 3.16 geben.
 
Zuletzt bearbeitet:

Asseon

Draic Kin

Registriert
14 Juli 2013
Beiträge
10.353
Ort
Arcadia
Wäre es dafür nicht praktisch einen Weg herauszufinden, bei dem es immer zum Absturz kommt? Ansonsten ist das als debugging eher schlecht geeignet, oder?
äh stimmt :m
versuch doch mal mit gpu intensiven Anwendungen zu "spielen" und schau ob du das damit triggern kannst

Hehe, seit Jahren versuche ich nach jedem nouveau Update diesen Treiber zu installieren, jedes mal ist es damit nichtmal möglich mich einzuloggen, weil es schon davor zur kernel panic kommt. Diese Idee werde ich daher eher nicht verwerten können^^
mal mit early KMS start probiert? mit late start hab ich auch Probleme.
wobei NV50 chips eigentlich keine Probleme mehr machen sollte laut nouveau wiki ist es einer der am unterstützten Serien :/
 

kpj

NGBler

Registriert
27 Juli 2014
Beiträge
98
  • Thread Starter Thread Starter
  • #13
äh stimmt :m
versuch doch mal mit gpu intensiven Anwendungen zu "spielen" und schau ob du das damit triggern kannst
Das habe ich heute getan (diverse Spiele per Steam gespielt), und es kam zu keinem Absturz O.o
War irgendwie zu erwarten, dass es plötzlich nicht mehr abstürzt, wenn man versucht einen Absturz herbeizuführen :p


mal mit early KMS start probiert? mit late start hab ich auch Probleme.
wobei NV50 chips eigentlich keine Probleme mehr machen sollte laut nouveau wiki ist es einer der am unterstützten Serien :/
Jo, hatte alles versucht. Wie genau sahen deine Probleme aus? Und hat nouveau gegenüber nvidia irgendwelche besonderen Vor-/Nachteile?

In der Regel erfolgt bei einem Updates des Kernels auch ein Update der Nvidia-Treiber in [extra].
Auch bei Minor-Release Updates?


edit: Das ist jetzt kein Scherz, aber 3 Minuten nachdem ich diesen Post verfasst habe ist mein Rechner wieder mit dem bekannten Problem abgestürzt.
Nachdem ich dann neugestartet habe (das ging auch erst wieder nach 2 Versuchen), konnte ich mich anmelden, wurde danach aber von einem Bildschirm mit schwarzen, flackernden Streifen begrüßt. Außerdem hing meine Maus immer wieder (quasi ein ähnliches Verhalten, wie wenn der RAM voll ist).
Außerdem waren folgende Nachrichten im Log:
[src=bash]
Jul 27 16:54:50 archer kernel: NVRM: Xid (PCI:0000:02:00): 8, Channel 00000001
Jul 27 16:54:52 archer kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Jul 27 16:54:54 archer kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Jul 27 16:54:55 archer kernel: NVRM: Xid (PCI:0000:02:00): 69, Class Error: ChId 0001, Class 00000030, Offset 00000000, Data 00000000, ErrorCode 00000000
Jul 27 16:54:55 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:54:55 archer kernel: NVRM: Xid (PCI:0000:02:00): 10, Ch 007e Ins 0000ff00 Off 00000000 Data 00000000
Jul 27 16:54:55 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 00000001 Instance 0000ff00 status 0000001d
Jul 27 16:54:55 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:54:55 archer kernel: NVRM: Xid (PCI:0000:02:00): 10, Ch 007e Ins 0000ff00 Off 00000000 Data 00000000
Jul 27 16:54:55 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:54:55 archer kernel: NVRM: Xid (PCI:0000:02:00): 12, Ch 0000007e Cl 00000030 Off 00000104 Data 00000000
Jul 27 16:54:55 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:54:55 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:54:55 archer kernel: NVRM: Xid (PCI:0000:02:00): 12, Ch 0000007e Cl 00000030 Off 00000100 Data 00000000
Jul 27 16:54:55 archer kernel: NVRM: Xid (PCI:0000:02:00): 12, Ch 0000007e Cl 00000030 Off 00000100 Data 00000000
Jul 27 16:55:06 archer kernel: NVRM: Xid (PCI:0000:02:00): 8, Channel 00000001
Jul 27 16:55:06 archer kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Jul 27 16:55:06 archer kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Jul 27 16:55:06 archer slim[476]: [943:972:0727/165506:ERROR:nss_util.cc(853)] After loading Root Certs, loaded==false: NSS error code: -8018
Jul 27 16:55:07 archer kernel: NVRM: Xid (PCI:0000:02:00): 69, Class Error: ChId 0001, Class 00000030, Offset 00000000, Data 00000000, ErrorCode 00000000
Jul 27 16:55:07 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:55:07 archer kernel: NVRM: Xid (PCI:0000:02:00): 10, Ch 007e Ins 0000ff00 Off 00000000 Data 00000000
Jul 27 16:55:07 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 00000001 Instance 0000ff00 status 0000001d
Jul 27 16:55:07 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:55:07 archer kernel: NVRM: Xid (PCI:0000:02:00): 10, Ch 007e Ins 0000ff00 Off 00000000 Data 00000000
Jul 27 16:55:07 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:55:07 archer kernel: NVRM: Xid (PCI:0000:02:00): 12, Ch 0000007e Cl 00000030 Off 00000104 Data 00000000
Jul 27 16:55:07 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:55:07 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:55:07 archer kernel: NVRM: Xid (PCI:0000:02:00): 12, Ch 0000007e Cl 00000030 Off 00000100 Data 00000000
Jul 27 16:55:07 archer kernel: NVRM: Xid (PCI:0000:02:00): 12, Ch 0000007e Cl 00000030 Off 00000100 Data 00000000
Jul 27 16:55:09 archer kernel: NVRM: Xid (PCI:0000:02:00): 6, PE0003
Jul 27 16:55:12 archer slim[476]: [943:972:0727/165512:ERROR:gservices_settings.cc(103)] Setting not found: checkin_interval
Jul 27 16:55:14 archer kernel: NVRM: Xid (PCI:0000:02:00): 8, Channel 00000001
Jul 27 16:55:16 archer kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Jul 27 16:55:18 archer kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Jul 27 16:55:19 archer kernel: NVRM: Xid (PCI:0000:02:00): 69, Class Error: ChId 007e, Class 00000030, Offset 00000000, Data 00000000, ErrorCode 00000000
Jul 27 16:55:19 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:55:19 archer kernel: NVRM: Xid (PCI:0000:02:00): 10, Ch 007e Ins 0000ff00 Off 00000000 Data 00000000
Jul 27 16:55:19 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:55:26 archer kernel: NVRM: Xid (PCI:0000:02:00): 8, Channel 00000001
Jul 27 16:55:28 archer kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Jul 27 16:55:48 archer kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Jul 27 16:55:48 archer kernel: NVRM: Xid (PCI:0000:02:00): 69, Class Error: ChId 0001, Class 00000030, Offset 00000000, Data 00000000, ErrorCode 00000000
Jul 27 16:55:48 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:55:48 archer kernel: NVRM: Xid (PCI:0000:02:00): 10, Ch 007e Ins 0000ff00 Off 00000000 Data 00000000
Jul 27 16:55:48 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 00000001 Instance 0000ff00 status 0000001d
Jul 27 16:55:48 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:55:48 archer kernel: NVRM: Xid (PCI:0000:02:00): 10, Ch 007e Ins 0000ff00 Off 00000000 Data 00000000
Jul 27 16:55:48 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:55:48 archer kernel: NVRM: Xid (PCI:0000:02:00): 12, Ch 0000007e Cl 00000030 Off 00000104 Data 00000000
Jul 27 16:55:48 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:55:48 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:55:48 archer kernel: NVRM: Xid (PCI:0000:02:00): 12, Ch 0000007e Cl 00000030 Off 00000100 Data 00000000
Jul 27 16:55:48 archer kernel: NVRM: Xid (PCI:0000:02:00): 12, Ch 0000007e Cl 00000030 Off 00000100 Data 00000000
Jul 27 16:55:48 archer kernel: NVRM: Xid (PCI:0000:02:00): 8, Channel 00000001
Jul 27 16:55:48 archer kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Jul 27 16:55:48 archer kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Jul 27 16:55:48 archer kernel: NVRM: Xid (PCI:0000:02:00): 69, Class Error: ChId 007e, Class 00000030, Offset 00000000, Data 00000000, ErrorCode 00000000
Jul 27 16:55:48 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:55:48 archer kernel: NVRM: Xid (PCI:0000:02:00): 10, Ch 007e Ins 0000ff00 Off 00000000 Data 00000000
Jul 27 16:55:48 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:55:48 archer slim[476]: [982:982:0727/205533:ERROR:gles2_cmd_decoder.cc(9452)] Onscreen context lost via ARB/EXT_robustness. Reset status = GL_UNKNOWN_CONTEXT_RESET_EXT
Jul 27 16:55:48 archer slim[476]: [982:982:0727/205533:ERROR:gles2_cmd_decoder.cc(2985)] GLES2DecoderImpl: Context lost during MakeCurrent.
Jul 27 16:55:48 archer slim[476]: [982:982:0727/205533:ERROR:gles2_cmd_decoder.cc(2985)] GLES2DecoderImpl: Context lost during MakeCurrent.
Jul 27 16:55:48 archer slim[476]: [943:967:0727/165544:ERROR:connection.cc(1060)] Web sqlite error 1, errno 0: no such column: image_url, sql: SELECT id, short_name, keyword, favicon_url, url, safe_for_autoreplace, originating_url, date_created, usage_count, input_encodings, show_in_default_list, suggest_url, prepopulate_id, created_by_policy, instant_url, last_modified, sync_guid, alternate_urls, search_terms_replacement_key, image_url, search_url_post_params, suggest_url_post_params, instant_url_post_params, image_url_post_params, new_tab_url FROM keywords ORDER BY id ASC
Jul 27 16:55:52 archer kernel: NVRM: Xid (PCI:0000:02:00): 8, Channel 00000001
Jul 27 16:55:52 archer kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Jul 27 16:55:54 archer kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Jul 27 16:55:55 archer kernel: NVRM: Xid (PCI:0000:02:00): 69, Class Error: ChId 007e, Class 00000030, Offset 00000000, Data 00000000, ErrorCode 00000000
Jul 27 16:55:55 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:55:55 archer kernel: NVRM: Xid (PCI:0000:02:00): 10, Ch 007e Ins 0000ff00 Off 00000000 Data 00000000
Jul 27 16:55:55 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:56:02 archer kernel: NVRM: Xid (PCI:0000:02:00): 8, Channel 00000001
Jul 27 16:56:04 archer kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Jul 27 16:56:06 archer kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Jul 27 16:56:07 archer kernel: NVRM: Xid (PCI:0000:02:00): 69, Class Error: ChId 007e, Class 00000030, Offset 00000000, Data 00000000, ErrorCode 00000000
Jul 27 16:56:07 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:56:07 archer kernel: NVRM: Xid (PCI:0000:02:00): 10, Ch 007e Ins 0000ff00 Off 00000000 Data 00000000
Jul 27 16:56:07 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:56:14 archer kernel: NVRM: Xid (PCI:0000:02:00): 8, Channel 00000001
Jul 27 16:56:16 archer kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Jul 27 16:56:18 archer kernel: NVRM: os_schedule: Attempted to yield the CPU while in atomic or interrupt context
Jul 27 16:56:19 archer kernel: NVRM: Xid (PCI:0000:02:00): 69, Class Error: ChId 0001, Class 00000030, Offset 00000000, Data 00000000, ErrorCode 00000000
Jul 27 16:56:19 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:56:19 archer kernel: NVRM: Xid (PCI:0000:02:00): 10, Ch 007e Ins 0000ff00 Off 00000000 Data 00000000
Jul 27 16:56:19 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 00000001 Instance 0000ff00 status 0000001d
Jul 27 16:56:19 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:56:19 archer kernel: NVRM: Xid (PCI:0000:02:00): 10, Ch 007e Ins 0000ff00 Off 00000000 Data 00000000
Jul 27 16:56:19 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:56:19 archer kernel: NVRM: Xid (PCI:0000:02:00): 12, Ch 0000007e Cl 00000030 Off 00000104 Data 00000000
Jul 27 16:56:19 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:56:19 archer kernel: NVRM: Xid (PCI:0000:02:00): 9, Channel 0000007e Instance 0000ff00 status 0000001d
Jul 27 16:56:19 archer kernel: NVRM: Xid (PCI:0000:02:00): 12, Ch 0000007e Cl 00000030 Off 00000100 Data 00000000
Jul 27 16:56:19 archer kernel: NVRM: Xid (PCI:0000:02:00): 12, Ch 0000007e Cl 00000030 Off 00000100 Data 00000000d
[/src]
Kann man daraus etwas neues ableiten? Es scheint so, als wären noch ein paar chromium Messages mit drin. Leider weiß ich nicht, ob die mit dem Fehler zusammenhängen, oder nicht.
 
Zuletzt bearbeitet:

thom53281

SYS64738
Teammitglied

Registriert
14 Juli 2013
Beiträge
6.918
Daran hatte ich auch gedacht, es aber schnell wieder verdrängt, weil das sehr doof wäre...
Manchmal muss man auch unschönen Tatsachen in's Auge sehen. Gerade in der Vorgängerserie hatte Nvidia massivste Probleme mit ausfallenden Chips, vor allem bei Notebookgrafikkarten. Immerhin dürfte Dein Gerät jetzt auch schon vermutlich um die 4-5 Jahre alt sein, was zumindest für günstigere Notebooks schon ein beachtliches Alter ist (sofern Du so eines hast).

Aber wollen wir mal hoffen, dass meine Vermutung auch nur eine Vermutung bleibt. Jedenfalls solltest Du dem mal nachgehen. :)


Grüße
Thomas
 

kpj

NGBler

Registriert
27 Juli 2014
Beiträge
98
  • Thread Starter Thread Starter
  • #15
Manchmal muss man auch unschönen Tatsachen in's Auge sehen. Gerade in der Vorgängerserie hatte Nvidia massivste Probleme mit ausfallenden Chips, vor allem bei Notebookgrafikkarten. Immerhin dürfte Dein Gerät jetzt auch schon vermutlich um die 4-5 Jahre alt sein, was zumindest für günstigere Notebooks schon ein beachtliches Alter ist (sofern Du so eines hast).
Tatsächlich habe ich ein MacBook Pro 5.1, welches fast schon 6 Jahre alt sein dürfte (jetzt bitte nicht mit hate gegen Apple beginnen :p ).

Aber wollen wir mal hoffen, dass meine Vermutung auch nur eine Vermutung bleibt. Jedenfalls solltest Du dem mal nachgehen. :)
Wie würde ich dem denn am Besten nachgehen? Den Fehler in der Hardware sicher festzustellen ist doch eher schwierig, oder?
 
Zuletzt bearbeitet:

thom53281

SYS64738
Teammitglied

Registriert
14 Juli 2013
Beiträge
6.918
Sicher feststellen ist immer so eine Sache. Wenn Dir aber eine beliebige Live-CD oder z. B. auch das originale OSX ebenfalls mit den selben oder ähnlichen Symptomen abschmieren würden, dann wäre es ein eindeutiges Indiz. Nur muss man, wie Du schon richtig sagst, erst einmal eine Methode finden, bei dem es recht eindeutig zu einem Absturz kommen sollte. Wobei man aber es aber auch einfach mal eine Stunde versuchsweise mit einem anderen System laufen lassen könnte, oder so.

Hast Du btw. schonmal die Temperaturen des Grafikchips kontrolliert? Nach 6 Jahren sind Notebooklüfter meistens mit Staubfusseln verstopft, vor allem wenn man sie gerne auf dem Sofa benutzt.

Ist der Auszug von /var/log/messages eigentlich komplett? Ich hätte da noch auf sowas wie ein [kw]NVRM: GPU at 0000:01:00.0 has fallen off the bus.[/kw] gehofft, siehe auch hier.

Added later: Thinking on this further, the hang on Parted Magic was with the Nouveau driver for the nVidia card. Which is the “free”, open source driver for nVidia chips. But the hang under Mageia 1 was with the closed, proprietary nVidia driver. As far as I know, these are different enough that a problem in one would not be in the other (Corrections welcome.) This suggests to me that my nVidia based card was actually going bad.


Grüße
Thomas
 

kpj

NGBler

Registriert
27 Juli 2014
Beiträge
98
  • Thread Starter Thread Starter
  • #17
Sicher feststellen ist immer so eine Sache. Wenn Dir aber eine beliebige Live-CD oder z. B. auch das originale OSX ebenfalls mit den selben oder ähnlichen Symptomen abschmieren würden, dann wäre es ein eindeutiges Indiz. Nur muss man, wie Du schon richtig sagst, erst einmal eine Methode finden, bei dem es recht eindeutig zu einem Absturz kommen sollte. Wobei man aber es aber auch einfach mal eine Stunde versuchsweise mit einem anderen System laufen lassen könnte, oder so.
Ich habe auf meinem Laptop noch einen weiteren, selbstgebastelten Kernel rumliegen, mit dem ich soweit noch keinerlei Probleme gehabt habe. Auf diesem Kernel kann ich zB keine 3D Spiele spielen, da ich irgendetwas dafür nötiges nicht aktiviert hatte (ist schon etwas länger her, dass ich den Kernel baute, sorry).
Interessant ist folgendes:
[src=bash]
$ lsmod | grep nvidia
$ [/src]
(kein output)

Hast Du btw. schonmal die Temperaturen des Grafikchips kontrolliert? Nach 6 Jahren sind Notebooklüfter meistens mit Staubfusseln verstopft, vor allem wenn man sie gerne auf dem Sofa benutzt.
Ich hatte meine Lüfter zwar schon gesäubert, habe aber trotzdem manchmal das Problem, dass ich die eingebaute Tastatur nicht nutzen kann, weil ich mir sonst meine Finger verbrennen würde (das ist tendenziell dann wohl eher ein schlechtes Zeichen).


Ist der Auszug von /var/log/messages eigentlich komplett? Ich hätte da noch auf sowas wie ein [kw]NVRM: GPU at 0000:01:00.0 has fallen off the bus.[/kw] gehofft, siehe auch hier.
Das ist kein Auszug von /var/log/messages.log gewesen, sonder kam von 'journalctl'. Ich habe mir messages.log mal angesehen und bemerkt, dass manche Logs von journalctl dort gar nicht drinstanden (und die von dir erwähnte Message auch nicht).
Überraschenderweise konnte ich dort aber Crashes von X zu einer ähnlichen Zeit wie den Abstürzen sehen:
[src=bash]Jul 27 16:49:48 localhost slim[459]: (EE) [mi] These backtraces from mieqEnqueue may point to a culprit higher up the stack.
Jul 27 16:49:48 localhost slim[459]: (EE) [mi] mieq is *NOT* the cause. It is a victim.
Jul 27 16:49:48 localhost slim[459]: (EE) [mi] EQ overflow continuing. 100 events have been dropped.
Jul 27 16:49:48 localhost slim[459]: (EE)
Jul 27 16:49:48 localhost slim[459]: (EE) Backtrace:
Jul 27 16:49:48 localhost slim[459]: (EE) 0: /usr/bin/X (xorg_backtrace+0x56) [0x58f186]
Jul 27 16:49:48 localhost slim[459]: (EE) 1: /usr/bin/X (QueuePointerEvents+0x52) [0x44e602]
Jul 27 16:49:48 localhost slim[459]: (EE) 2: /usr/lib/xorg/modules/input/evdev_drv.so (0x7fd455cb4000+0x60ba) [0x7fd455cba0ba]
Jul 27 16:49:48 localhost slim[459]: (EE) 3: /usr/lib/xorg/modules/input/evdev_drv.so (0x7fd455cb4000+0x657d) [0x7fd455cba57d]
Jul 27 16:49:48 localhost slim[459]: (EE) 4: /usr/bin/X (0x400000+0x74d18) [0x474d18]
Jul 27 16:49:48 localhost slim[459]: (EE) 5: /usr/bin/X (0x400000+0x9e5b9) [0x49e5b9]
Jul 27 16:49:48 localhost slim[459]: (EE) 6: /usr/lib/libpthread.so.0 (0x7fd45e1be000+0xf4b0) [0x7fd45e1cd4b0]
Jul 27 16:49:48 localhost slim[459]: (EE) 7: /usr/bin/X (0x400000+0x193420) [0x593420]
Jul 27 16:49:48 localhost slim[459]: (EE) 8: /usr/lib/libpthread.so.0 (0x7fd45e1be000+0xf4b0) [0x7fd45e1cd4b0]
Jul 27 16:49:48 localhost slim[459]: (EE) 9: /usr/lib/libc.so.6 (ioctl+0x7) [0x7fd45ceeae47]
Jul 27 16:49:48 localhost slim[459]: (EE) 10: /usr/lib/xorg/modules/drivers/nvidia_drv.so (0x7fd456e55000+0x113bdc) [0x7fd456f68bdc]
Jul 27 16:49:48 localhost slim[459]: (EE) 11: /usr/lib/xorg/modules/drivers/nvidia_drv.so (0x7fd456e55000+0x113c97) [0x7fd456f68c97]
Jul 27 16:49:48 localhost slim[459]: (EE) 12: /usr/lib/xorg/modules/drivers/nvidia_drv.so (0x7fd456e55000+0x1149fe) [0x7fd456f699fe]
Jul 27 16:49:48 localhost slim[459]: (EE) 13: /usr/lib/xorg/modules/drivers/nvidia_drv.so (0x7fd456e55000+0xd6eed) [0x7fd456f2beed]
Jul 27 16:49:48 localhost slim[459]: (EE) 14: /usr/lib/xorg/modules/drivers/nvidia_drv.so (0x7fd456e55000+0x53fce) [0x7fd456ea8fce]
Jul 27 16:49:48 localhost slim[459]: (EE) 15: /usr/lib/xorg/modules/drivers/nvidia_drv.so (0x7fd456e55000+0xafddf) [0x7fd456f04ddf]
Jul 27 16:49:48 localhost slim[459]: (EE) 16: /usr/lib/xorg/modules/drivers/nvidia_drv.so (0x7fd456e55000+0xaa023) [0x7fd456eff023]
Jul 27 16:49:48 localhost slim[459]: (EE) 17: /usr/lib/xorg/modules/drivers/nvidia_drv.so (0x7fd456e55000+0xaa6c3) [0x7fd456eff6c3]
Jul 27 16:49:48 localhost slim[459]: (EE) 18: /usr/lib/xorg/modules/drivers/nvidia_drv.so (0x7fd456e55000+0x68500) [0x7fd456ebd500]
Jul 27 16:49:48 localhost slim[459]: (EE) 19: /usr/lib/xorg/modules/drivers/nvidia_drv.so (0x7fd456e55000+0xd5eab) [0x7fd456f2aeab]
Jul 27 16:49:48 localhost slim[459]: (EE) 20: /usr/lib/xorg/modules/drivers/nvidia_drv.so (0x7fd456e55000+0x573ea6) [0x7fd4573c8ea6]
Jul 27 16:49:48 localhost slim[459]: (EE) 21: /usr/bin/X (0x400000+0x11940d) [0x51940d]
Jul 27 16:49:48 localhost slim[459]: (EE) 22: /usr/bin/X (0x400000+0x32bda) [0x432bda]
Jul 27 16:49:48 localhost slim[459]: (EE) 23: /usr/bin/X (0x400000+0x36b2f) [0x436b2f]
Jul 27 16:49:48 localhost slim[459]: (EE) 24: /usr/bin/X (0x400000+0x3ad16) [0x43ad16]
Jul 27 16:49:48 localhost slim[459]: (EE) 25: /usr/lib/libc.so.6 (__libc_start_main+0xf0) [0x7fd45ce29000]
Jul 27 16:49:48 localhost slim[459]: (EE) 26: /usr/bin/X (0x400000+0x250fe) [0x4250fe]
[/src]
Ich bin mir leider immer noch nicht sicher, wo genau ich nach welchen Merkmalen suchen muss, die mir dann bei der Problemlösung helfen könnten :(
 
Zuletzt bearbeitet:

Asseon

Draic Kin

Registriert
14 Juli 2013
Beiträge
10.353
Ort
Arcadia
Das habe ich heute getan (diverse Spiele per Steam gespielt), und es kam zu keinem Absturz O.o
War irgendwie zu erwarten, dass es plötzlich nicht mehr abstürzt, wenn man versucht einen Absturz herbeizuführen :p
typisch ^^

Jo, hatte alles versucht. Wie genau sahen deine Probleme aus? Und hat nouveau gegenüber nvidia irgendwelche besonderen Vor-/Nachteile?
Inzwischen funktioniert das bei mir Problemlos habs grad nochmal probiert, an den Fehler den ich "damals" hatte erinnere ich mich leider nicht mehr.
Allerdings benutze ich im Normalen Betrieb den proprietären Treiber weil zumindest für meinen graka in nouveau praktisch kein 3D Support vorhanden ist.

Hauptvorteil von nouveau ist eben die Unterstützung KMS wodurch du aufm Terminal und in X den selben Ausgabemodus hast, kein Flackern beim wechseln der TTY etc., außerdem wird die native Bildschirmauflösung idr bereits während des bootens gesetzt.
 

thom53281

SYS64738
Teammitglied

Registriert
14 Juli 2013
Beiträge
6.918
Ich hatte meine Lüfter zwar schon gesäubert, habe aber trotzdem manchmal das Problem, dass ich die eingebaute Tastatur nicht nutzen kann, weil ich mir sonst meine Finger verbrennen würde (das ist tendenziell dann wohl eher ein schlechtes Zeichen).
Wenn Du auf der Tastatur bereits >50° hast, wie warm wird es dann erst unter der Tastatur sein? Hol Dir bitte einmal lm_sensors und beobachte die Temperaturen über einen längeren Zeitraum. Ich kenne das Macbook nicht, hätte aber geschätzt, dass 60-70° Maximaltemperatur normal sein sollten. Bis 85° wäre auch noch in Ordnung, aber heißer sollte das Gerät möglichst nicht werden. Auch wenn die Hardware vermutlich bis 100° "aushalten" sollte - es ist zumindest alles andere als normal.

Lass das System auch mal bitte einige Zeit testweise mit Deinem bisher absturzfreien Kernel laufen, die Abstürze scheinen ja recht sporadisch aufzutreten. Mit einem [kw]dd if=/dev/zero of=/dev/null[/kw] könntest Du auch für etwas CPU/IO-Auslastung sorgen um die Temperaturen etwas in die Höhe zu treiben.


Grüße
Thomas
 
Oben