Merkwürdiges Initialisierungsproblem mit Hitachi 4K120

to stream or not to stream
bitsucker
Interessierter
Interessierter
Beiträge: 39
Registriert: Freitag 23. September 2005, 08:35

Merkwürdiges Initialisierungsproblem mit Hitachi 4K120

Beitrag von bitsucker »

Nachdem diverse Testläufe meines IDE-Interface (neue Version von dbox2.com) mit einer alten 2GB Notebookplatte aus dem Fundus recht ermutigend verlaufen waren, hatte ich mir nun eine neue 2,5" Platte mit recht geringer Leistungsaufnahme gekauft (Hitachi Travelstar 4K120, HTS421210H9AT00, 100GB, 4200rpm) mit der es nun leider alles andere als gut läuft.

Vorab:

Die Platte ist nicht nur neu sondern auch in Ordnung (Test mit Hitachi Testtool auf PC einwandfrei) und wenn sie denn in der Box läuft, funktioniert auch alles einwandfrei (diverse Aufnahmetests (bis zu 1h) waren O.K.)

Box ist eine Nokia mit AVIA600, Image ist ein Yadi 2.2.0.0

Aufgrund der erfolgreichen Aufnahmetests mit beiden Platten, gehe ich auch davon aus, dass das IDE Interface prinzipiell in Ordnung ist.

Das Ganze scheint also ein reines Initialisierungsproblem zu sein, das sich folgendermassen äussert:

Ich hatte die Platte zunächst über den onboard Schaltregler des Interface versorgt. Dabei passiert mit grosser Regelmässigkeit folgendes:

Code: Alles auswählen

Uniform Multi-Platform E-IDE driver Revision: 7.00beta4-2.4
ide: Assuming 50MHz system bus speed for PIO modes; override with idebus=xx
dboxide: $Id: main.c,v 1.10 2006/10/04 00:36:41 carjay Exp $
ide: late registration of driver.
dboxide: activating cs2
dboxide: address space of DBox2 IDE CPLD is at: 0xc3ba2000
dboxide: fifo didn't get empty in time
CPLD Status is 10120076
dboxide: trace
079fef9c: OUTB        16       a0
c3b854ec c3b9db80 c3b8e9b4 c3b9dbf8 
trace end.
Probing IDE interface ide0...
dboxide: inb: fifo not empty?!

CPLD Status is 10120076
dboxide: trace
trace end.
Die Box hängt nun, keine weiteren Ausgaben auf der Konsole. Ziehe ich jetzt den Powerstecker der Platte kurz ab und stecke ihn wieder auf, läuft die Box weiter und der Zugriff auf die Platte geht entweder schief:

Code: Alles auswählen

ide0: Wait for ready failed before probe !
oder es klappt:

Code: Alles auswählen

hda: HTS421210H9AT00, ATA DISK drive
ide0 at 0x010-0x017,0x04e on irq 47
hda: attached ide-disk driver.
hda: host protected area => 1
hda: 195371568 sectors (100030 MB) w/7528KiB Cache, CHS=12161/255/63
Partition check:
 /dev/ide/host0/bus0/target0/lun0: p1 p2
Ich hatte dann den Spannungversorgungsjumper umgesteckt (Versorgung über den Modemport) und es schien zunächst zu funktionieren. Dies scheint aber nur der Fall zu sein, wenn die Box nur relativ kurz im Deep Standby war. Ist sie länger ausgeschaltet, tritt oft sogar schon vor dem Laden des IDE-Treibers folgender heftiger Fehler auf:

Code: Alles auswählen

Calibrating delay loop... 66.96 BogoMIPS
Oops: kernel access of bad area, sig: 11
NIP: C0028D28 XER: A000C03C LR: C002A168 SP: C0147830 REGS: c0147780 TRAP: 0300 
   Not tainted
MSR: 00009032 EE: 1 PR: 0 FP: 0 ME: 1 IR/DR: 11
DAR: BF810010, DSISR: C2000000
TASK = c0145910[0] 'swapper' Last syscall: 0 
last math 00000000 last altivec 00000000
GPR00: 00000001 C0147830 C0145910 C01C8120 FFFFFFFF 00000001 C01C813C 00000080 
GPR08: C01C8138 BF810010 C0198000 7C0802A6 00000000 00031BFC 01FFBA00 00000001 
GPR16: FFFFFFFF 007FFF00 01FF6114 00000000 C0140000 C0165510 C0140000 00000000 
GPR24: C0130000 00000001 00002000 00000ECD 00000000 00004000 C01C8120 C01C8120 
Call backtrace: 
00004000 C015A3C4 C0158964 C015738C C0002138 
Kernel panic: Attempted to kill the idle task!
In idle task - not syncing
 <0>Rebooting in 180 seconds..
oder noch besser:

Code: Alles auswählen

Freeing unused kernel memory: 60k init
SQUASHFS error: lzma_fs returned unexpected result 0x1
SQUASHFS error: Unable to read page, block 241f0, size 5c4e
init started:  BusyBox v1.2.1 (2007.03.17-16:04+0000) multi-call event: $Id: eve
nt.c,v 1.12 2003/09/30 05:45:38 obi Exp $
[i2c-8xx]: mpc 8xx i2c init
[i2c-8xx]: adapter: 0
Detected STB:
  Vendor: Nokia
  Model: D-BOX2 
$Id: cam.c,v 1.30 2004/01/10 16:36:34 alexw Exp $
kernel BUG at page_alloc.c:261!
Oops: Kernel Mode Software FPU Emulation, sig: 8
NIP: C002A728 XER: 00000000 LR: C002A728 SP: C1C9DB20 REGS: c1c9da70 TRAP: 1000 
   Not tainted
MSR: 00001032 EE: 0 PR: 0 FP: 0 ME: 1 IR/DR: 11
TASK = c1c9c000[37] 'insmod' Last syscall: 3 
last math 00000000 last altivec 00000000
GPR00: C002A728 C1C9DB20 C1C9C000 00000020 00001032 00000001 FFFFCE86 C01510BB 
GPR08: 00000000 C0160000 00000002 C1C9DA20 C0160000 10076964 00000001 10050000 
GPR16: 10070000 00000001 C0022214 00000001 000001F0 C0148BFC 00000000 00000000 
GPR24: C0160000 00000000 C0148974 00000001 00000000 00000007 C0148A00 C01E4420 
Call backtrace: 
C002A728 C002AB4C C002B028 C00274C0 C00282EC C006E914 C006EC00 
C006CD54 C006CE14 C006CE84 C0021DF4 C00223F4 C00328C4 C000285C 
C389594C C0010FF8 C000285C 10022980 10003D2C 10003DA8 0FEB517C 
00000000 
Floating point exception
kernel BUG at page_alloc.c:261!
Oops: Kernel Mode Software FPU Emulation, sig: 8
NIP: C002A728 XER: 00000000 LR: C002A728 SP: C1C9DDA0 REGS: c1c9dcf0 TRAP: 1000 
   Not tainted
MSR: 00001032 EE: 0 PR: 0 FP: 0 ME: 1 IR/DR: 11
TASK = c1c9c000[38] 'insmod' Last syscall: 128 
last math 00000000 last altivec 00000000
GPR00: C002A728 C1C9DDA0 C1C9C000 00000020 00001032 00000001 FFFFD205 C01510BB 
GPR08: 00000000 C0160000 00000002 C1C9DCA0 C0160000 10076964 C0140000 C38BE000 
GPR16: 00400000 C0144C38 C38BD000 000001E5 000001F2 C0148C1C 000BE000 00000000 
GPR24: C0160000 00000000 C0148974 000BD000 00000000 00000007 C0148A00 C01E4420 
Call backtrace: 
C002A728 C002AB4C C0026D48 C0010994 C000285C 10022980 10003D2C 
10003DA8 0FEB517C 00000000 
Floating point exception
kernel BUG at page_alloc.c:261!
Oops: Kernel Mode Software FPU Emulation, sig: 8
NIP: C002A728 XER: 00000000 LR: C002A728 SP: C1C9DCA0 REGS: c1c9dbf0 TRAP: 1000 
   Not tainted
MSR: 00001032 EE: 0 PR: 0 FP: 0 ME: 1 IR/DR: 11
TASK = c1c9c000[39] 'insmod' Last syscall: 166 
last math 00000000 last altivec 00000000
GPR00: C002A728 C1C9DCA0 C1C9C000 00000020 00001032 00000001 FFFFD512 C01510BB 
GPR08: 00000000 C0160000 00000002 C1C9DBA0 C0160000 10076964 00000001 00000000 
GPR16: 00000000 00000000 00000000 10070000 000001D2 C0148C1C 00000000 00000000 
GPR24: C0160000 00000000 C0148974 C1EAA210 00000000 00000007 C0148A00 C01E4420 
Call backtrace: 
C002A728 C002AB4C C001D7F8 C0009C38 C0002AA8 C00114DC C000285C 
10021B58 10003D2C 10003DA8 0FEB517C 00000000 
Floating point exception
kernel BUG at page_alloc.c:261!
Oops: Kernel Mode Software FPU Emulation, sig: 8
NIP: C002A728 XER: 00000000 LR: C002A728 SP: C1C9DCA0 REGS: c1c9dbf0 TRAP: 1000 
   Not tainted
MSR: 00001032 EE: 0 PR: 0 FP: 0 ME: 1 IR/DR: 11
TASK = c1c9c000[40] 'insmod' Last syscall: 166 
last math 00000000 last altivec 00000000
GPR00: C002A728 C1C9DCA0 C1C9C000 00000020 00001032 00000001 FFFFD831 C01510BB 
GPR08: 00000000 C0160000 00000002 C1C9DBA0 C0160000 10076964 00000001 00000000 
GPR16: 00000000 00000000 00000000 10070000 000001D2 C0148C1C 00000000 00000000 
GPR24: C0160000 00000000 C0148974 C1EAA210 00000000 00000007 C0148A00 C01E4420 
Call backtrace: 
C002A728 C002AB4C C001D7F8 C0009C38 C0002AA8 C00114DC C000285C 
10021B58 10003D2C 10003DA8 0FEB517C 00000000 
Floating point exception
kernel BUG at page_alloc.c:261!
Oops: Kernel Mode Software FPU Emulation, sig: 8
NIP: C002A728 XER: 00000000 LR: C002A728 SP: C1C9DE40 REGS: c1c9dd90 TRAP: 1000 
   Not tainted
MSR: 00001032 EE: 0 PR: 0 FP: 0 ME: 1 IR/DR: 11
TASK = c1c9c000[41] 'insmod' Last syscall: 166 
last math 00000000 last altivec 00000000
GPR00: C002A728 C1C9DE40 C1C9C000 00000020 00001032 00000001 FFFFDB50 C01510BB 
GPR08: 00000000 C0160000 00000002 C1C9DD40 C0160000 10076964 00000001 00000000 
GPR16: 00000000 00000000 00000000 10070000 000001F0 C0148BFC 7FFFFD60 00000000 
GPR24: C0160000 00000000 C0148974 00000004 00000000 00000007 C0148A00 C01E4420 
Call backtrace: 
C002A728 C002AB4C C002B028 C001146C C000285C 10021A88 10003D2C 
10003DA8 0FEB517C 00000000 
Floating point exception
kernel BUG at page_alloc.c:261!
Oops: Kernel Mode Software FPU Emulation, sig: 8
NIP: C002A728 XER: 00000000 LR: C002A728 SP: C1BC7DC0 REGS: c1bc7d10 TRAP: 1000 
   Not tainted
MSR: 00001032 EE: 0 PR: 0 FP: 0 ME: 1 IR/DR: 11
TASK = c1bc6000[44] 'rcS' Last syscall: 6 
last math 00000000 last altivec 00000000
GPR00: C002A728 C1BC7DC0 C1BC6000 00000020 00001032 00000001 FFFFDE5D C01510BB 
GPR08: 00000000 C0160000 00000002 C1BC7CC0 C0160000 10076964 00000000 00000000 
GPR16: 00000000 00000000 30021760 00000001 000001D2 C0148C1C 00000000 00000000 
GPR24: C0160000 00000000 C0148974 C1EAA290 00000000 00000007 C0148A00 C01E4420 
Call backtrace: 
C002A728 C002AB4C C001D670 C0009C38 C0002AA8 300081F8 3000A7C8 
3000A61C 00000003 1003B2B0 10043248 10040AAC 10040A68 10040AAC 
10040A68 10040AAC 10040F58 10041544 10003D2C 10003DA8 0FEB517C 
00000000 
kernel BUG at page_alloc.c:261!
Oops: Kernel Mode Software FPU Emulation, sig: 8
NIP: C002A728 XER: 00000000 LR: C002A728 SP: C1C9DC30 REGS: c1c9db80 TRAP: 1000 
   Not tainted
MSR: 00001032 EE: 0 PR: 0 FP: 0 ME: 1 IR/DR: 11
TASK = c1c9c000[43] 'ifup' Last syscall: 3 
last math 00000000 last altivec 00000000
GPR00: C002A728 C1C9DC30 C1C9C000 00000020 00001032 00000001 FFFFE1D9 C01510BB 
GPR08: 00000000 C0160000 00000002 C1C9DB30 C0160000 10076964 00000000 10070000 
GPR16: 00000000 7FFFFE74 C0022214 00000001 000001D2 C0148C1C 00000000 00000000 
GPR24: C0160000 00000000 C0148974 C1EAA210 00000000 00000007 C0148A00 C01E4420 
Call backtrace: 
C002A728 C002AB4C C001D7F8 C0009C38 C0002AA8 C1FEF6A4 C0021BE8 
C00223F4 C00328C4 C000285C 0FEDE214 0FEDBF9C 0FEDE284 0FEDE118 
0FEDA2C0 1004ADD4 1004AE74 100249D0 10003D2C 10003DA8 0FEB517C 
00000000 
Floating point exception
Oops: kernel access of bad area, sig: 11
NIP: C00272C8 XER: 20000000 LR: C00272B8 SP: C1BCFEE0 REGS: c1bcfe30 TRAP: 0300 
   Not tainted
MSR: 00001032 EE: 0 PR: 0 FP: 0 ME: 1 IR/DR: 11
DAR: 38610006, DSISR: C0000000
TASK = c1bce000[45] 'rcS' Last syscall: 5 
last math 00000000 last altivec 00000000
GPR00: C0198E40 C1BCFEE0 C1BCE000 00000001 00009032 00000000 00000008 3860FFF2 
GPR08: 00800080 00000000 C00320F8 28004082 28004082 10076964 00000000 00000000 
GPR16: 00000000 00000000 00000000 00000000 00009032 01BCFF40 00000000 C0002AA8 
GPR24: C0002800 10070000 00000000 C0160000 FFFFFC18 000001F0 C0198E38 C0198E30 
Call backtrace: 
10000000 C003E738 C0032118 C000285C 0FF76140 1003E5E0 100421F8 
10040AAC 10040AAC 10040AAC 10040F58 10041544 10003D2C 10003DA8 
0FEB517C 00000000
In allen Fehlerfällen hilft ein Reset der Box und sie läuft einwandfrei hoch, findet und mounted die Platte.

Es sieht also so aus, als ob es dieser Platte gelingt, den CPLD beim Hochfahren völlig aus dem Tritt zu bringen, teils sogar so, dass er den Bootvorgang noch vor Laden des IDE Treibers stört.

Hier scheint mir also hardwaremässig (im Interface) noch irgendwas im Argen zu liegen.

Hier noch ein paar Beobachtungen:

Um die Hochlaufzeit der Platte etwas zu verkürzen, hatte ich schliesslich deren Konfiguration so verändert, dass sie nicht im Standby hochfährt, sondern sofort anläuft (um zu sehen, ob dies das Problem löst oder verändert).
Dabei stellte ich fest, dass der Motor der Platte nach dieser Änderung zwar sowohl im PC bzw. auch wenn Sie nur mit Spannung versorgt wird (kein Interface angeschlossen) sofort anläuft, dies aber nicht tut, wenn sie am IDE Interface der dbox angeschlossen ist. Hier läuft der Motor trotzdem erst an, wenn der Zugriff durch den Treiber erfolgt!

Zieht man nach dem Einschalten der Box den Powerstecker der Platte kurz ab und steckt ihn wieder an, scheint dies das Problem auch zu lindern, das Hochlaufen und mounten der Platte funktioniert dann in der Regel.

Das Problem mit dem Kernel Error (siehe Log weiter oben) konnte ich auch mit der anderen Platte (IBM DTNA-22160) reproduzieren. Die (ständig anliegende) Versorgung der Platte über den Modemport scheint also generell nicht empfehlenswert zu sein.

Hat hier jemand ähnliche Beobachtungen gemacht oder eine IDEe ?
Charles Darwin jun.
Erleuchteter
Erleuchteter
Beiträge: 664
Registriert: Donnerstag 24. August 2006, 11:19

Beitrag von Charles Darwin jun. »

Also ich hatte vor mehr als einem Jahr ein ähnliches Problem mit einem internen IDE/USB-Wechselrahmen...
...das war aber unabhängig von der Platte und noch mit dem Hallenbergschen IF

http://forum.tuxbox-cvs.sourceforge.net ... hp?t=42787
Gorcon
Tuxboxer
Tuxboxer
Beiträge: 5873
Registriert: Samstag 23. Februar 2002, 22:46

Beitrag von Gorcon »

Die (ständig anliegende) Versorgung der Platte über den Modemport scheint also generell nicht empfehlenswert zu sein.
So ist es.
Dabei stellte ich fest, dass der Motor der Platte nach dieser Änderung zwar sowohl im PC bzw. auch wenn Sie nur mit Spannung versorgt wird (kein Interface angeschlossen) sofort anläuft, dies aber nicht tut, wenn sie am IDE Interface der dbox angeschlossen ist. Hier läuft der Motor trotzdem erst an, wenn der Zugriff durch den Treiber erfolgt!
Das ist normal. Wenn die Platte dann anläuft und dabei (auch wenn nur Kurzzeitig) zu viel Strom zieht kommt es zu den von Dir genannten Problemen.
Entweder ist der Schaltregler nicht richtig abgeblocktoder die Spannung ist nicht stabil (warum auch immer). Möglich sind auch ungünstige Leitungsführungen auf dem Interface (mit dem Schaltregler).

Gruß Gorcon
Stingray
Erleuchteter
Erleuchteter
Beiträge: 453
Registriert: Mittwoch 27. Juni 2007, 15:25

Beitrag von Stingray »

Hallo,

ein Blick in die Datenblätter der beiden Festplatten hätte eigentlich genügt um zu wissen, daß genau diese Festplatten deutlich mehr als 0.7A beim anlaufen ziehen und somit NICHT für die Versorgung über den Modemport geeignet sind.
Ich denke das ist auf dem Bild in der Einbauanleitung ausreichend erklärt.

Eine mögliche Fehlerursache für das andere Problem (fifo not empty) könnte ein nicht ausreichender Kontakt zum Ram-Port der Box sein.

Übrigens gibt es dieses Problem auch mit dem Hallenberg-IDE.
Unter anderem zu finden hier:

http://tuxbox-forum.dreambox-fan.de/for ... fifo+empty

oder hier:

http://tuxbox-forum.dreambox-fan.de/for ... fifo+empty

oder hier:

http://tuxbox-forum.dreambox-fan.de/for ... fifo+empty

oder hier:

http://tuxbox-forum.dreambox-fan.de/for ... fifo+empty

oder hier:

http://tuxbox-forum.dreambox-fan.de/for ... fifo+empty

oder hier:

http://tuxbox-forum.dreambox-fan.de/for ... fifo+empty

oder hier:

http://tuxbox-forum.dreambox-fan.de/for ... fifo+empty

und hier:

http://tuxbox-forum.dreambox-fan.de/for ... fifo+empty

@Gorcon
Möchtest Du nicht einmal eine Umfrage starten um herauszufinden wer die Platte über Modemport bzw. Schaltregler versorgt und wer nicht?
Aus diversen Beiträgen und Erfahrungenberichten sowie vom Feedback einiger Kunden weiß ich, daß es genug Anwender gibt die die Festplatte ohne Probleme über den Modemport versorgen.

Gruß Basti
bitsucker
Interessierter
Interessierter
Beiträge: 39
Registriert: Freitag 23. September 2005, 08:35

Beitrag von bitsucker »

Hallo,
ein Blick in die Datenblätter der beiden Festplatten hätte eigentlich genügt um zu wissen, daß genau diese Festplatten deutlich mehr als 0.7A beim anlaufen ziehen und somit NICHT für die Versorgung über den Modemport geeignet sind.
Das ist schon klar, die ersten Versuche wurden aber mit dem onboard Regler gestartet. Das testweise Umstecken auf die Modemportquelle erfolgte erst später im Zuge der Fehlersuche und war auch nicht für den Dauerbetrieb gedacht.

Abgesehen davon, liegt die tatsächlich zu beobachtende Spitzenlast oft deutlich unter dem worst case Wert der Datenblätter (Davon "leben" ja letzlich alle externen, nur über USB versorgten Platten, denn da ist oft bei 500mA Schluss).

BTW: Kennt eigentlich jemand ein aktuelles und lieferbares Laufwerk mit einer Spitzenlast von 3.5W (die 4,5W die bei der Hitachi spezifziert sind, waren der geringste Wert der mir bei meiner Suche untergekommen ist)?
Eine mögliche Fehlerursache für das andere Problem (fifo not empty) könnte ein nicht ausreichender Kontakt zum Ram-Port der Box sein.
Bei einem Kontaktproblem würde ich dann aber auch Probleme beim Betrieb (Aufnahme oder Wiedergabe) erwarten (die traten nicht auf) und ich glaube auch nicht, dass Kontaktprobleme durch einen Reset verschwinden.

Was die merkwürdigen Kernerl Errors angeht, habe ich mittlerweile festgestellt, dass die auch ohne angeschlossene Platte auftreten können (auch wieder beim Einschalten nach längerem deep standby). Ich werde heute Abend mal die Versorgung des onboard Reglers abklemmen und die Sache weiter untersuchen.

Übrigens gibt es dieses Problem auch mit dem Hallenberg-IDE.
Unter anderem zu finden hier:
Mir geht es vor allem um eine Lösung des Problems, weniger um eine (weitere) Hallen- contra Reh-berg Diskussion (Thema heisst ja auch "Initialisierungsproblem mit Hitachi ..." und nicht "Initialisierungsproblem mit neuem IDE2 Interface").
bitsucker
Interessierter
Interessierter
Beiträge: 39
Registriert: Freitag 23. September 2005, 08:35

Beitrag von bitsucker »

So,

ich hatte jetzt in der Zwischenzeit mal die Versorgung des onboard Schaltreglers abgeklemmt, was aber keine Veränderung gebracht hat.

Ich hatte, um sicher zu gehen, auch das Interface nochmal ausgebaut. -> die Box startet problemlos (mehrere Versuche aus dem deep standby).

Kontakte der Konnektoren auf Interface und Box nochmal mit Lupe gecheckt, Kontakte auf dem Board zur Sicherheit nochmal gereinigt, Interface wieder eingebaut (keine Platte angeschlossen!), Stecker rein und :

Code: Alles auswählen

   Verifying Checksum ... OK
   Uncompressing Kernel Image ... OK
Linux version 2.4.34-dbox2 (ImageTeam@yadi.org) (gcc version 3.4.4) #2 Sa 17. Mr
 17:21:55 CET 2007
On node 0 totalpages: 8192
zone(0): 8192 pages.
zone(1): 0 pages.
zone(2): 0 pages.
Kernel command line: console=ttyS0 root=/dev/mtdblock1 rootfstype=squashfs
Decrementer Frequency = 251625000/60
m8xx_wdt: active wdt found (SWTC: 0xFFFF, SWP: 0x1)
m8xx_wdt: keep-alive trigger installed (PITC: 0x2580)
Console: colour dummy device 80x25
Calibrating delay loop... 66.76 BogoMIPS
kernel BUG at page_alloc.c:192!
Oops: Kernel Mode Software FPU Emulation, sig: 8
NIP: C002A318 XER: 8000C83C LR: C002A318 SP: C0147830 REGS: c0147780 TRAP: 1000 
   Not tainted
MSR: 00001032 EE: 0 PR: 0 FP: 0 ME: 1 IR/DR: 11
TASK = c0145910[0] 'swapper' Last syscall: 0 
last math 00000000 last altivec 00000000
GPR00: C002A318 C0147830 C0145910 00000020 00001032 00000001 FFFFC223 C01510BB 
GPR08: 00000000 C0160000 00000002 C0147730 C0160000 00031BFC 01FFBA00 00000001 
GPR16: FFFFFFFF 007FFF00 01FF6114 00000000 C0140000 C0170000 C0148A24 C0160000 
GPR24: C019A020 C01C9720 00000022 00001140 C01489F4 C0148974 FFFFFFC0 C01C8C20 
Call backtrace: 
C002A318 C015A3C4 C0158964 C015738C C0002138 
Kernel panic: Attempted to kill the idle task!
In idle task - not syncing
 <0>Rebooting in 180 seconds..
Nach einem Reset lief die Box dann wieder einwandfrei hoch.

Ich habe dann noch 12 Reboots gemacht, in allen Fällen lief die Box einwandfrei hoch. Dann wieder in den deep standby geschickt, nach 5 min wieder eingeschaltet und wieder der gleiche Fehler wie oben.

Das Interface hat also (unabhängig von der verwendeten Platte) offenbar ein Kaltstartproblem.
Vielleicht sieht ja der Verlauf der 3.3V OPA Spannung beim Hochlaufen aus dem deep standby, zumindest bei meiner Box, anders aus, als wenn diese Spannung, durch einen Reset, aus- und wieder eingeschaltet wird und der PLD hat hier irgendwie ein Initialisierungsproblem (wie ist da der Reset der internen Logik eigentlich realisiert?).
Gorcon
Tuxboxer
Tuxboxer
Beiträge: 5873
Registriert: Samstag 23. Februar 2002, 22:46

Beitrag von Gorcon »

als wenn diese Spannung, durch einen Reset, aus- und wieder eingeschaltet wird
Wird sie auch.
bitsucker
Interessierter
Interessierter
Beiträge: 39
Registriert: Freitag 23. September 2005, 08:35

Beitrag von bitsucker »

Ich habe nun das IDE Interface mal in eine andere NOKIA Box (Avia500) eingebaut und konnte dort o.g. Problem mit den "Kernel-Oops" nicht mehr feststellen.

Eine Erklärung dafür, was in der anderen Box (die ansonsten ohne jegliche Probleme läuft) vorgeht, wenn das Interface eingebaut ist, habe ich allerdings nach wie vor nicht.
Ich hatte mal folgendes Szenario überlegt: Die 3.3V fahren bei der Problembox langsamer hoch, wodurch die Initialisierung des CPLD länger dauert (Laden der Konfiguration geht beim ersten Versuch schief, wodurch der CPLD diesen Vorgang wiederholt). Die IOs des CPLD sind, solange die Konfiguration nicht geladen ist, in einem undefinierten Zustand und stören so evtl. die Initialisierung der SDRAMs, die ja am gleichen Bus wie das Interface hängen.

Wäre das aber der Fall, so dürfte sich das Problem dann nicht zeigen, wenn man nach dem Einschalten der Box nochmal manuell einen Reset auslöst. Dies ist aber nicht der Fall. Der Reset hilft erst, wenn man wartet, bis der "kernel: oops" aufgetreten ist, bzw. die Box nach:

Code: Alles auswählen

Freeing unused kernel memory: 60k init 

hängen bleibt.

Falls einer der Entwickler oder Hersteller des Interface irgendwelche Ambitionen hat, der Problemursache auf den Grund zu gehen, könnte ich die betreffende Box zur Verfügung stellen, bzw. mit enstsprechender Unterstützung selbst weitere Tests durchführen.


Das Initialisierungsproblem mit der Hitachi Platte (HTS421210H9AT00):

Code: Alles auswählen

dboxide: fifo didn't get empty in time
CPLD Status is 10120076
dboxide: trace
079fef9c: OUTB        16       a0
c3b854ec c3b9db80 c3b8e9b4 c3b9dbf8
trace end. 
ist ein davon unabhängiges Problem, es tritt auch in der anderen Box auf und zwar reproduzierbar immer dann, wenn die Platte NACH dem Interface mit Spannung versorgt wird. Dies ist ja bei Verwendung des Onboard Reglers der Fall, da der ja erst vom CPLD bzw. von der 3.3V Spannungsversorgung aktiviert wird. Am Regler selbst liegt es nicht, denn das Problem tritt auch bei Verwendung einer externen (und definitv einwandfreien) Versorgung auf, wenn diese erst nach dem Einschalten der Box eingeschaltet wird.

Hier hat wohl das CPLD Design evtl. noch einen Bug, zumindest wenn man davon ausgeht, dass der Anspruch des Interface ist, mit jeder ATA-konformen Platte zu funktionieren.

Die Platte kann ich allerdings nicht für Testzwecke zur Verfügung stellen, da ich sie bereits zurück gegeben habe und nun ein FUJITSU Modell einsetze (MHV2120AT, 120GB, 4200rpm) mit dem dieses Problem nicht auftritt.

BTW: Könnte man nicht evtl. einen "sticky" Thread hier reinhängen, in dem alle "Problemplatten" gelistet werden können? Das könnte vielleicht den ein- oder anderen Fehlkauf vermeiden.
Charles Darwin jun.
Erleuchteter
Erleuchteter
Beiträge: 664
Registriert: Donnerstag 24. August 2006, 11:19

Beitrag von Charles Darwin jun. »

Ist doch viel einfacher, wenn du gleich die Festplatte bei dbox2.com mitbestellst...

Glaube nicht, dass es was bringt, wenn wir hier jetzt alle HDDs durchtesten...aber ich kann mich irren :wink:
Gorcon
Tuxboxer
Tuxboxer
Beiträge: 5873
Registriert: Samstag 23. Februar 2002, 22:46

Beitrag von Gorcon »

Ich hatte mal folgendes Szenario überlegt: Die 3.3V fahren bei der Problembox langsamer hoch,
Das würde die CPU dann aber auch später starten lassen. Ich halte das für ausgeschlossen.
bitsucker
Interessierter
Interessierter
Beiträge: 39
Registriert: Freitag 23. September 2005, 08:35

Beitrag von bitsucker »

Charles Darwin jun. hat geschrieben:Ist doch viel einfacher, wenn du gleich die Festplatte bei dbox2.com mitbestellst...
Jo, und auch gleich viel teurer :D
Ausserdem haben die anscheinend nur Western Digital im Programm und die kommen für mich nicht in Frage (schlechte Erfahrungen in der Vergangenheit, die allerdings schon einige Zeit zurück liegen).
Glaube nicht, dass es was bringt, wenn wir hier jetzt alle HDDs durchtesten...aber ich kann mich irren :wink:


Das war auch nicht, was ich damit anregen wollte. Es ging mir darum, Infos über Platten zu sammeln, die im Zusammenhang mit dem Interface schon mal unangenehm aufgefallen sind, damit jemand der sich eine Platte kaufen will vielleicht nicht unbedingt zu einem Modell greift, mit dem schon mal jemand Probleme hatte.
Tommy
Tuxboxer
Tuxboxer
Beiträge: 4332
Registriert: Dienstag 7. Mai 2002, 17:04

Beitrag von Tommy »

@bitsucker: Erstell doch einen Wiki Artikel. Übers IDE gibts eh sehr wenig dort :wink:
---------------------------
Alle weiteren Infos findest Du im WIKI
Bitte vor dem posten Boardregeln lesen und verstehen!
Wie erstelle ich ein Bootlog? Wo finde ich die FAQ?
Stingray
Erleuchteter
Erleuchteter
Beiträge: 453
Registriert: Mittwoch 27. Juni 2007, 15:25

Beitrag von Stingray »

@Bitsucker

Wie gesagt gibt es für die genannten Fehler mehrere Fehlerursachen.
Ein defekt vom Prozessor oder vom Ram könnte hier auch eine Ursache sein. Vor allem weil Die Box immer die gleichen Fehlermeldungen bringt und auch an stellen hängt die typisch für diese defekte sind.

Du könntest ja mal selber versuchen den Ram zu tauschen, wenn Du die Möglichkeit hast. Denn die Fehlermeldungen aus dem Log deuten eher auf ein Ram-Problem hin.

Grundsätzlich halte ich nicht viel von IBM oder Hitachi Festplatten. Diese sind mir früher der Reihe nach abgeschmiert, da Sie auch nicht für den Dauerbetrieb geeignet waren.
Ich bin dann wieder zu WD gewechselt die vom Preis her zwar mehr kosten, mit denen ich bisher aber nur positive Erfahrungen gemacht habe.

Du mußt die Platten ja nicht im Shop mitbestellen. Dazu zwingt Dich ja keiner.

Gruß Basti
bitsucker
Interessierter
Interessierter
Beiträge: 39
Registriert: Freitag 23. September 2005, 08:35

Beitrag von bitsucker »

Hallo Stingray,
Wie gesagt gibt es für die genannten Fehler mehrere Fehlerursachen.
Ein defekt vom Prozessor oder vom Ram könnte hier auch eine Ursache sein. Vor allem weil Die Box immer die gleichen Fehlermeldungen bringt und auch an stellen hängt die typisch für diese defekte sind.
Du könntest ja mal selber versuchen den Ram zu tauschen, wenn Du die Möglichkeit hast. Denn die Fehlermeldungen aus dem Log deuten eher auf ein Ram-Problem hin.
ich kann mir nur schwer vorstellen, dass ein RAM Defekt vorliegen soll, denn die Box läuft nun schon seit einigen Tagen (ohne das Interface) im täglichen Betrieb, ohne jegliche Hänger, Abstürze oder Bootprobleme. Ich denke, ein RAM Defekt müsste sich hier, zumindest hin- und wieder, entsprechend bemerkbar machen. Abgesehen davon, war sie kurz vorher zur Reparatur (Tuner und S.E.C. getauscht), natürlich mit anschliessendem Test.

Darüberhinaus tritt das Problem mit dem Interface ja auch nur einmalig beim Hochfahren aus dem deep standby auf. Nach einem Reset (und allen folgenden Reboots) läuft alles bestens, der Fehler ist dann nicht mehr reproduzierbar.

Was die CPU angeht, die ist neu, allerdings handelt es sich nicht um das ursprünglich verbaute XPC Modell sondern um einen (RoHS-konformen) Nachfolger (MPC823...). Ich habe allerdings wenig Ambitionen, diesen nun wieder gegen einen XPC zu tauschen :D
Du mußt die Platten ja nicht im Shop mitbestellen. Dazu zwingt Dich ja keiner.
Ja, ich hab' das Thema ja auch gar nicht aufgebracht (vor dem Beitrag von Charles war mir noch nicht mal bewusst, dass Ihr überhaupt Festplatten im Programm habt). Das man, wenn man nicht auf den Verkauf von PC-Hardware spezialisiert ist, nicht die gleichen Preise machen und ein umfangreiches Sortiment anbieten kann wie z.B A*TER*ATE ist schon klar.
JtG-Riker
Image-Team
Beiträge: 1015
Registriert: Freitag 7. Februar 2003, 18:37

Beitrag von JtG-Riker »

Alsu ich muss Stingray schon rechtgeben, ich hab auch schon 2 Boxen gehabt die ohne Interfache 100% mit Linux funkionieren aber mit IF beim formatieren abgestürzt sind, nach CPU Wechsel liefen beide einwandfrei, die letzte ist gerade mal 3 Wochen her.

Es gibt auch durchaus Boxen die mit BN laufen aber beim Linuxbooten schon abstürzen, da ist auch oft die CPU defekt, hab ich auch schon gehabt das die beim U-Boot laden schon resetten weil wohl dann ein defektes Register gesetzt wird das bei BN nicht genutzt wird oder so.

Gruß Riker
Stingray
Erleuchteter
Erleuchteter
Beiträge: 453
Registriert: Mittwoch 27. Juni 2007, 15:25

Beitrag von Stingray »

Wenn ich hier schon auf eventuelle Fehler von der Box hinweise, dann tue ich das doch nicht weil ich langeweile habe.
Das sind einfach Erfahrungswerte die ich im laufe der Jahre sammeln konnte.

Dir ist aber schon bewußt, das auch der Prozessor beim einlöten beschädigt werden kann. Das passiert zwar sehr sehr selten, ist aber nicht auszuschließen. Obwohl ich meine Anlage immer mit dem gleichen Temperaturprofil beim einlöten fahre, ist mir auch schon einmal ein Prozessor abgestorben.

Es muß aber wie gesagt gar nicht am Proz. liegen. Meine Vermutung geht ja eher in Richtung Ram. Und der ist ja viel einfacher und schneller gewechselt.

Wenn Du meine Hilfe nicht annehmen möchtest, dann ist das auch Ok für mich und ich werde mich zu diesem Thema nicht weiter äußern.

Gruß Basti
Zuletzt geändert von Stingray am Mittwoch 21. November 2007, 10:31, insgesamt 2-mal geändert.
Charles Darwin jun.
Erleuchteter
Erleuchteter
Beiträge: 664
Registriert: Donnerstag 24. August 2006, 11:19

Beitrag von Charles Darwin jun. »

bitsucker hat geschrieben:Das war auch nicht, was ich damit anregen wollte. Es ging mir darum, Infos über Platten zu sammeln, die im Zusammenhang mit dem Interface schon mal unangenehm aufgefallen sind, damit jemand der sich eine Platte kaufen will vielleicht nicht unbedingt zu einem Modell greift, mit dem schon mal jemand Probleme hatte.
Sowas kann aber auch ganz schnell dazu führen, dass Platten in Verruf kommen...

Um die Sache reproduzierbar zu machen, müßten zumindest 2 über das gleiche Problem berichten...aber in bezug auf diese Platte bist du anscheinend bisher der einzige...

...also vielleicht ist es ja dann doch der RAM oder der Prozessor?! :gruebel:

Hab gerade den Hardware-inkompatibilitäts-thread (puuuh...schwieriges Wort) nach vorne geschoben...