Paket manpages-de: Umlaute KDE kio_man: bei manchen man-pages richtig, bei manchen falsch

23/03/2014 - 19:50 von Nina Steiger | Report spam
Guten Tag,

ich versuche nun schon seit einiger Zeit raus zubekommen, warum bei Debian
Wheezy / Jessie manche man Pages aus dem Paket manpages-de in KDE-Konqueror
mit richtigen Umlauten angezeigt werden und manche nicht.

Beispiel:

mit man:/usr/share/man/de/man1/cat.1.gz werden die deutschen Umlaute korrekt
angezeigt: cat Section: Dienstprogramme für Benutzer (1)


mit man:/usr/share/man/de/man1/tr.1.gz werden die deutschen Umlaute falsch
angzeigt; tr Section: Dienstprogramme fà¼r Benutzer (1)

In der Konsole werden mit man cat bzw. man tr die Umlaute bei beiden
korrekt angezeigt

zcat /usr/share/man/de/man1/tr.1.gz | file -ib -
liefert text/troff; charset=utf-8

zcat /usr/share/man/de/man1/cat.1.gz | file -ib -
liefert text/troff; charset=utf-8

Im folgenden sind die troff-Quelltexte und die HTML-Quelltexte für cat und tr
teilweise angegeben


Der troff Quelltext für cat ist:

8X--

\" -*- coding: UTF-8 -*-
.\" DO NOT MODIFY THIS FILE! It was generated by help2man 1.35.
.\"*******************************************************************
.\"
.\" This file was generated with po4a. Translate the source file.
.\"
.\"*******************************************************************
.TH CAT 1 "Juli 2013" "GNU coreutils 8.21" "Dienstprogramme für Benutzer"
.SH BEZEICHNUNG
cat \- Dateien aneinanderhàngen und in die Standardausgabe schreiben
.SH ÜBERSICHT
\fBcat\fP [\fIOPTION\fP]... [\fIDATEI\fP]...
.SH BESCHREIBUNG
.\" Add any additional description here
.PP
DATEI(en) oder Standardeingabe auf Standardausgabe verketten.
.TP
\fB\-A\fP, \fB\-\-show\-all\fP

.

8X--



Der troff Quelltext für tr ist:

8X--

\" -*- coding: UTF-8 -*-
.\" DO NOT MODIFY THIS FILE! It was generated by help2man 1.35.
.\"*******************************************************************
.\"
.\" This file was generated with po4a. Translate the source file.
.\"
.\"*******************************************************************
.TH TR 1 "Juli 2013" "GNU coreutils 8.21" "Dienstprogramme für Benutzer"
.SH BEZEICHNUNG
tr \- Zeichen umwandeln oder löschen
.SH ÜBERSICHT
\fBtr\fP [\fIOPTION\fP]... \fIMENGE1 \fP[\fIMENGE2\fP]
.SH BESCHREIBUNG
.\" Add any additional description here
.PP
Zeichen aus der Standardeingabe umwandeln, zusammenfassen oder löschen und
in die Standardausgabe schreiben.
.TP
\fB\-c\fP, \fB\-C\fP, \fB\-\-complement\fP
Das Komplement von MENGE1 benutzen
.TP
\fB\-d\fP, \fB\-\-delete\fP
Zeichen aus MENGE1 löschen, nicht umwandeln



8X--


Der Quelltext der in Konqueror für cat angezeigten HTML-Seite ist

8X--

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"><html><head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<title>CAT
Manpage</title>
<link rel="stylesheet" href="help:/common/kde-default.css" type="text/css">
<link rel="stylesheet"
href="file:///usr/share/kde4/apps/kio_docfilter/kio_docfilter.css"
type="text/css">
<style type="text/css">
#header_top { background-image: url("help:/common/top.jpg"); }

#header_top div { background-image: url("help:/common/top-left.jpg"); }

#header_top div div { background-image: url("help:/common/top-right.jpg"); }

</style>

<meta name="ROFF_Type" content="man">
</head>

<body>

<div id="header"><div id="header_top">
<div><div>
<img src="help:/common/top-kde.jpg" alt="top-kde"> CAT - KDE Man Page
Viewer</div></div></div></div>
<div style="margin-left: 5em; margin-right: 5em;">
<h1>CAT</h1>
Section: Dienstprogramme für Benutzer (1)


<h2>BEZEICHNUNG</h2>
<div>

cat - Dateien aneinanderhàngen und in die Standardausgabe schreiben
</div>

<h2>ÜBERSICHT</h2>
<div>



8X--


Der Quelltext der in Konqueror für tr angezeigten HTML-Seite ist

8X--

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"><html><head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<title>TR
Manpage</title>
<link rel="stylesheet" href="help:/common/kde-default.css" type="text/css">
<link rel="stylesheet"
href="file:///usr/share/kde4/apps/kio_docfilter/kio_docfilter.css"
type="text/css">
<style type="text/css">
#header_top { background-image: url("help:/common/top.jpg"); }

#header_top div { background-image: url("help:/common/top-left.jpg"); }

#header_top div div { background-image: url("help:/common/top-right.jpg"); }

</style>

<meta name="ROFF_Type" content="man">
</head>

<body>

<div id="header"><div id="header_top">
<div><div>
<img src="help:/common/top-kde.jpg" alt="top-kde"> TR - KDE Man Page
Viewer</div></div></div></div>
<div style="margin-left: 5em; margin-right: 5em;">
<h1>TR</h1>
Section: Dienstprogramme fà¼r Benutzer (1)


<h2>BEZEICHNUNG</h2>
<div>

tr - Zeichen umwandeln oder löschen
</div>

<h2>àœBERSICHT</h2>
<div>
.

8X--

Ich habe weder im Browser Verlauf noch unter /var/cache irgendwelche gecachten
man-pages oder html-Seiten gefunden

Any suggestions?

Danke fürs Lesen

Nina


To UNSUBSCRIBE, email to debian-l10n-german-REQUEST@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org
Archive: https://lists.debian.org/6746278.uQCpvh5F5V@chronos
 

Lesen sie die antworten

#1 Mario Blättermann
23/03/2014 - 21:40 | Warnen spam
Hallo Nina,

Am 23.03.2014 19:29, schrieb Nina Steiger:
Guten Tag,

ich versuche nun schon seit einiger Zeit raus zubekommen, warum bei Debian
Wheezy / Jessie manche man Pages aus dem Paket manpages-de in KDE-Konqueror
mit richtigen Umlauten angezeigt werden und manche nicht.



Das ist nicht auf Debian beschrànkt, das gilt distributionsübergreifend. Bei mir
in Fedora 20 ist es genauso.
Beispiel:

mit man:/usr/share/man/de/man1/cat.1.gz werden die deutschen Umlaute korrekt
angezeigt: cat Section: Dienstprogramme für Benutzer (1)


mit man:/usr/share/man/de/man1/tr.1.gz werden die deutschen Umlaute falsch
angzeigt; tr Section: Dienstprogramme fà¼r Benutzer (1)

In der Konsole werden mit man cat bzw. man tr die Umlaute bei beiden
korrekt angezeigt



So weit, so gut. Das Problem habe ich wie gesagt auch, aber ich habe es auf die
Erzeugungsweise der Handbuchseiten mit po4a geschoben und war der Meinung, dass
*alle* Dateien aus man-pages-de im KDE-Hilfezentrum falsch angezeigt werden.

Dass cat korrekt angezeigt wird, war mir neu. Mir war nur immer aufgefallen,
dass andere deutsche Manpages das Problem nicht haben, zum Beispiel kpat(6), das
aus XML-Quellen erzeugt wird.

zcat /usr/share/man/de/man1/tr.1.gz | file -ib -
liefert text/troff; charset=utf-8

zcat /usr/share/man/de/man1/cat.1.gz | file -ib -
liefert text/troff; charset=utf-8



Daran liegt es also offensichtlich nicht, und auch das Durchzappen diverser
Zeichenkodierungen im Hilfezentrum bringt nichts. Interessanterweise wird die
Manpage von tr korrekt angezeigt, wenn sie auf anderem Wege erzeugt wird,
nàmlich mit help2man (so wie auch die englischsprachigen Originale):

[ ~]$ help2man -L de_DE cat > cat.1
[ ~]$ help2man -L de_DE tr > tr.1

Hier ist die Anzeige, wie sie sein soll. Allerdings ist ein Trick nötig, um das
Hilfezentrum tatsàchlich die lokale Datei und nicht die in der Datenbank
registrierte Version anzeigen zu lassen: Du musst in Dolphin (oder Konqueror,
wie auch immer) die Dateieigenschaften für Roff-Quelltexte àndern. Dazu ist ein
neuer Eintrag anzulegen, und unter »Programm« tràgst du folgende Befehlszeile ein:

khelpcenter "man:%f"

Freilich ist dadurch unser Problem nicht gelöst, aber zumindest wissen wir, dass
help2man eine korrekte Ausgabe liefert. Das Problem ist mit Sicherheit
irgendeine winzige Kleinigkeit in den Roff-Quelldateien, aber ich habe keine
Ahnung, was es sein könnte.

Ganz nebenbei, das Verfahren spart uns eigentlich die externe Verwaltung der
deutschen Handbuchseiten der coreutils. Man müsste nur die Upstream-Entwickler
dazu bringen, die übersetzten Versionen auf die gleiche Weise zu erzeugen wie
die englischen. Freilich sollten wir dann noch mal die UI-Strings auf Fehler
abklopfen (insbesondere die Ausgaben mit --help und --version). Die werden bei
translationproject.org verwaltet, wo einige von uns auch involviert sind. Sollte
also kein Problem sein.

Gruß Mario


To UNSUBSCRIBE, email to
with a subject of "unsubscribe". Trouble? Contact
Archive: https://lists.debian.org/

Ähnliche fragen