trennen/zusammenfassen/vergleichen von Text

05/10/2007 - 23:10 von Oliver Beck | Report spam
Guten Abend,

ich habe folgende Aufgabenstellung:

Ich erhalte ein Text-File (resp. .DOC/.RTF, darum kann man sich spaeter
kuemmern). Mit diesem Text-File soll folgendes geschehen:

- Einlesen

open()


- Trennen der einzelnen Saetze

Da manche Saetze ueber das Zeilenende hinaus gehen, tu ich mich
etwas schwer, hier ein ('simplen') RegExp zu nutzen. Aber sicher
muesste ich die Datei als Ganzes in ein grosses Array lesen und
dann viele (abhaengig von der Anzahl Saetze) kleine Arrays
bilden.

- Vergleichen der einzelnen Saetze miteinander

Jetzt wirds tricky (fuer mich :)
Nun sollen alle Saetze (wortbasiert) miteinander verglichen
werden um die Gleichheit in % auszugeben.

Beispiel:

Satz eins: "Das ist Satz eins"
Satz zwei: "Hier steht Satz zwei mit ein wenig mehr Text"
Satz drei: "Das ist Satz 3"
Die Zahl wird nicht als Wort gewertet.

S1 <-> S2 = 1 Wort von 12 gleich / ~8.3%
S1 <-> S3 = 3 Woerter von 7 gleich / ~42.9%
S2 <-> S3 = 1 Wort von 11 gleich / ~9.1%

Ich hoffe, ich konnte es ausreichend erklaeren. Wenn nicht werde ich
auftauchende Fragen umgehend beantworten.

Danke im Voraus!

Mit freundlichen Gruessen/Best Regards Oliver Beck

/"\ -ASCII-Ribbon-Campaign- |
\ / Against HTML Mail |
X | -- German GNU/Hurd documentation --
/ \ | - http://de-hurd-doc.berlios.de -
 

Lesen sie die antworten

#1 Frank Seitz
05/10/2007 - 23:17 | Warnen spam
Oliver Beck wrote:

ich habe folgende Aufgabenstellung:


[...]
Ich hoffe, ich konnte es ausreichend erklaeren. Wenn nicht werde ich
auftauchende Fragen umgehend beantworten.



Wie sieht Dein bisheriger Lösungsansatz aus?
Was genau ist Dein Problem?

Grüße
Frank
Dipl.-Inform. Frank Seitz; http://www.fseitz.de/
Anwendungen für Ihr Internet und Intranet
Tel: 04103/180301; Fax: -02; Industriestr. 31, 22880 Wedel

Ähnliche fragen