Ich habe mich mal ein wenig umgesehen und mir einen neuen linkchecker besorgt. Der erste Eindruck ist ganz gut. Ich denke, ich werde das Tool in Zukunft regelmaessig einsetzen. Ich stelle mir vor, demnaechst das Testen der links direkt im Anschluss an das Spiegeln nach Giessen vorzunehmen, d.h. sobald ein File an seinen endgueltigen Ort verschoben ist, werden interne und externe links geprueft. Da sich am Tag ueblicherweise wenige Files aendern, duerfte der Aufwand vertretbar sein. Man hat dann sofort eine Kontrolle. In groesseren Abstaenden testet man dann die "alten Huete". Wer vorab schon mal gucken will: Die Ergebnisse fuer alle Files, die sich in den vergangenen 7 Tagen geaendert haben, liegen unter http://w3g.med.uni-giessen.de/linkdoc/new.981114/linklint.html (interne) <<< file: summary.txt host: w3g.med.uni-giessen.de date: Sat, 14 Nov 1998 21:07:49 (local) Linklint version: 2.1 Linklint found 429 files and checked 126 html files. There were 12 missing files. 12 files had broken links. 35 errors, 3 warnings. <<< http://w3g.med.uni-giessen.de/linkdoc/new.981114/urlindex.html (externe) <<< file: urlsum.txt host: w3g.med.uni-giessen.de date: Sat, 14 Nov 1998 21:07:49 (local) Linklint version: 2.1 Linklink checked 247 urls: 230 were ok, 12 failed. 26 urls moved. 5 hosts failed: 5 urls could be retried. 17 files had failed urls. There were 29 files with broken links. <<< Da ihr in der vergangenen Woche fleissig wart und 429 files produziert bzw verschoben habt, ist der Report natuerlich auch sehr gross ausgefallen. Das duerfte dann in Zukunft (bei taeglicher Pruefung) nicht mehr so sein. Insgesamt moechte ich noch ein bisschen daran herumfeilen, z.B. eine automatische Message in diese Gruppe und eine Startseite, die etwas uebersichtlicher ist, als der aktuelle Zustand (directory mit 56! files) Von meinen Tests gestern gibt es auch noch je ein Verzeichnis reg und vereine, die die Ergebnisse fuer die gleichnamigen Subdirectories enthalten (nur interne links). Bei reg habe ich allerdings die sehr grossen Verzeichnisse CH, ESE und SUD weggelassen, das Tool hat leider auch seine Grenzen. Diese Megadirectories wuerde man dann einzeln pruefen. Bei T-Online Homedirectories, die ohne abschliessenden / angegeben sind (und daher ein 302-moved provozieren), ist offenbar ein Fehler entweder im linklint oder im Server von T-Online, es wird dann faelschlich nach einem lokalen Verzeichnis gesucht und entsprechend ein Fehler gemeldet. Ein gutes Naechtle allerseits! Arthur.Teschler@uni-giessen.de
Arthur wrote:
Ich stelle mir vor, demnaechst das Testen der links direkt im Anschluss an das Spiegeln nach Giessen vorzunehmen, d.h. sobald ein File an seinen endgueltigen Ort verschoben ist, werden interne und externe links geprueft. Da sich am Tag ueblicherweise wenige Files aendern, duerfte der Aufwand vertretbar sein. Man hat dann sofort eine Kontrolle.
It is easy to see how one would check the links referenced in the newly moved file. But how do you easily check the links from other files to that newly moved file? They could be broken by the change. -- =Jim Eggert EggertJ@LL.mit.edu
On Sat, 14 Nov 1998, Jim Eggert wrote:
Arthur wrote:
Ich stelle mir vor, demnaechst das Testen der links direkt im Anschluss an das Spiegeln nach Giessen vorzunehmen, d.h. sobald ein File an seinen endgueltigen Ort verschoben ist, werden interne und externe links geprueft. Da sich am Tag ueblicherweise wenige Files aendern, duerfte der Aufwand vertretbar sein. Man hat dann sofort eine Kontrolle.
It is easy to see how one would check the links referenced in the newly moved file. But how do you easily check the links from other files to that newly moved file? They could be broken by the change.
Da muss man unterscheiden: 1.) Ein File wird von tmp an die Finalposition gebracht, weil sich eine Aenderung ergibt (update einer bestehenden Seite). Dann stimmen die links von anderen Seiten noch, denn das File existiert ja nach wie vor, allerdings mit anderem Inhalt. 2.) Ein File entsteht neu. Dann muessen auch andere Files neu entstehen, sonst wird die Seite ueberhaupt nicht referenziert. 3.) Ein File verschwindet ganz. Dann wird es schwierig, denn man muss all Seiten, die diese removed Seite referenzieren, kontrollieren und entweder ebenfalls loeschen oder aendern. Loeschen heisst in diesem Zusammenhang auch Verschieben in ein anderes Directory. Im Logfile des Mirroring gibt es die Eintraege "Got <some-file>" und "Removed <some-file>" Ich ueberlege, ob es einfacher ist, einmal pro Woche oder Monat *alles* zu checken, oder ob man ueber den Cross-Index (z.B. http://w3g.med.uni-giessen.de/linkdoc/new.981114/fileX.txt ) die referenzierenden Files sucht und in die Pruefung aufnimmt. Ich bin noch am Probieren ... Arthur.Teschler@uni-giessen.de
Arthur schrieb:
1.) Ein File wird von tmp an die Finalposition gebracht, weil sich eine Aenderung ergibt (update einer bestehenden Seite). Dann stimmen die links von anderen Seiten noch, denn das File existiert ja nach wie vor, allerdings mit anderem Inhalt.
Es sei denn, wenn das Link von der anderen Seite ein # enthaelt, dann kann es jetzt falsch sein. Ein grober Fehler ist es ja nicht, denn die Seite wird sowieso geladen, nur vom Anfang gezeigt, statt vom richtigen Platz.
Ich bin noch am Probieren ...
You the man! -- =Jim Eggert EggertJ@LL.mit.edu
Link-Fehler in -rw-r--r-- 1 milbran userb2 10784 Nov 17 10:19 events.html -rw-r--r-- 1 milbran userb2 6882 Nov 17 10:03 events_old.html korrigiert. Bitte nach /gene/ghlp/ an die richtige Stelle verschieben. Dann gibt es hoffentlich keine Fehler mehr in new.981116/error.html, errorF.html, errorX.html von mir. Gruß Volker -------------------------------------------------------------------------- Dipl.-Math. Volker Milbrandt Tel. 0711 / 685-5320 ; priv. 0711 / 7286036 Math.Inst.B / 2.LS, Univ. Stuttgart, Pfaffenwaldring 57, D-70550 Stuttgart Email: milbrandt@gmx.de oder Milbrandt@mathematik.uni-stuttgart.de
participants (3)
-
Arthur Teschler
-
Jim Eggert
-
Volker Milbrandt