Forums Neueste Beiträge
 

[docutils] reStructuredText parsen

30/08/2010 - 13:39 von Ole Streicher | Report spam
Hallo,

ich suche die Möglichkeit, einen einfach formatierbaren ASCII-Text zu
parsen (um ihn dann spàter in ein MS-Word-Format zu wandeln). Dabei
hatte ich an reStructuredText gedacht, weil das ziemlich verbreitet zu
sein scheint. Leider werde ich aus der Dokumentation der docutils nicht
so recht schlau.

Könnte mir jemand mal einen Anfang geben? Konkret suche ich eine
Funktion, die einen als reStructuredText formatierten String als Input
bekommt und in einer Struktur (z.B. als XML) zurückgibt.

Spàter wàre es eventuell noch interessant, zu erfahren, welche Methoden
man konkret implementieren muss, um ein neues Backend (?)
einrurichten -- eben Office Open XML. Das ist aber eher optional, da ich
eigentlich keinen einfachen Konverter bauen will, sondern eine
Spezialanwendung benötige (die u.a. noch matplotlib-Bilder einbaut).

Kann mir jemand eine Starthilfe geben?

Viele Grüße

Ole
 

Lesen sie die antworten

#1 Peter Otten
30/08/2010 - 14:16 | Warnen spam
Ole Streicher wrote:

ich suche die Möglichkeit, einen einfach formatierbaren ASCII-Text zu
parsen (um ihn dann spàter in ein MS-Word-Format zu wandeln). Dabei
hatte ich an reStructuredText gedacht, weil das ziemlich verbreitet zu
sein scheint. Leider werde ich aus der Dokumentation der docutils nicht
so recht schlau.

Könnte mir jemand mal einen Anfang geben? Konkret suche ich eine
Funktion, die einen als reStructuredText formatierten String als Input
bekommt und in einer Struktur (z.B. als XML) zurückgibt.

Spàter wàre es eventuell noch interessant, zu erfahren, welche Methoden
man konkret implementieren muss, um ein neues Backend (?)
einrurichten -- eben Office Open XML. Das ist aber eher optional, da ich
eigentlich keinen einfachen Konverter bauen will, sondern eine
Spezialanwendung benötige (die u.a. noch matplotlib-Bilder einbaut).

Kann mir jemand eine Starthilfe geben?

Viele Grüße

Ole

from docutils.core import publish_string
source = """\






... Hallo Welt
... ... Das *sollte* gehen
... """

print publish_string(source)






<document ids="hallo-welt" names="hallo\ welt" source="<string>"
title="Hallo Welt">
<title>
Hallo Welt
<paragraph>
Das
<emphasis>
sollte
gehen

print publish_string(source, writer_name="xml")






<?xml version="1.0" encoding="utf-8"?>
[snip]

Peter

Ähnliche fragen