[Search]Suche [Recent Topics]Neueste Themen [Hottest Topics]Hottest Topics [Members]Mitgliederliste [Groups]Zurück zur Startseite [Moderation Log]Moderation Log [Register]Registrieren [Login]Anmelden

Treffpunkt Konjugation

Das Forum für die deutsche Sprache

Index » Sonstiges » Grundlagen der Spracherkennung
Autor Beitrag
Failwell

Normal

Beigetreten: 06/08/2014 08:55:52
Beiträge: 1
Offline

Hallo liebe Community,

da dies ein freies Sprachforum ist, denke ich, das ich hier am nächsten an den gesuchten Informationen bin.

Ich bin ein Softwareentwickler, und gerade dabei eine Software zur Sprachanalyse und Übersetzung zu entwickeln. Die soll dann im Internet kostenfrei zur Verfügung gestellt werden (zur nichtkommerziellen Nutzung). Einen ersten ganz einfach Ansatz dazu gibt es schon. Den Link gebe ich erstmal nur auf Rückfrage heraus, damit das hier nicht als Werbung angesehen wird.

Aktuell gibt es ein einfaches System, welches einfach nur Worte eins zu eins übersetzt. Nun möchte ich aber einen Schritt weitergehen, und das Tool auf einen Stand bringen, in dem es Sätze analysieren kann. Dazu soll es Satzbestandteile erkennen und aus den Regeln der Ausgangssprache eine Art Zusammenhangs-Schema erstellen. Die Satzbildungsregeln für die einzelnen Sprachen sollen also flexibel konfigurierbar für die jeweilige Sprache sein - denn das Sprachen teils vollkommen andere Wege gehen ist mir soweit bewusst.
Über diese Schema möchte ich den Umweg über die "synthetische" Sprache Esperanto gehen, um anschließend aus Esperanto heraus in die Zielsprache zu übersetzen. Die Sprache Esperanto wird deshalb als Grundlage verwendet, da sie keine Ausnahmefälle und ungewöhnlichen Beugungen der Worte zulässt, sondern immer das selbe Schema auf die verschiedenen Wortarten anwendet (Bspw. durch Anhängen von Buchstaben an den Wortstamm). Das kommt mir als Softwareentwickler sehr entgegen, weil sich der Satz in Esperanto sehr gut verarbeiten und beurteilen lässt. So muss ich auch kein eigenes Parser-Schema mehr erstellen - sondern bekomme durch Esperanto eine gute Vorlage.

Als erste Ausgangssprache habe ich für dieses Projekt Deutsch gewählt, da es meine Muttersprache ist.
Mögliche Zielsprachen sind derzeit (in dieser Rangreihenfolge): Englisch, Französisch, Tschetschenisch und Polnisch. Weitere werden später folgen. Englisch dient hierbei als direkte Übersetzungsreferenz.

Nun würde mir erst einmal helfen, wenn jemand weiß, wo ich einen guten Überblick über die einzelnen möglichen Wortarten im Deutschen und die Beugungsregeln erhalte. Sehr weiterhelfen würde eine Mindmap oder ein Diagramm.
Noch weiter würde mir helfen, wenn sich jemand evtl. auch jemand in anderen Sprachen gut auskennt, und schon im Voraus sagen kann, mit welchen weiteren Fällen und Besonderheiten in jenen zu rechnen ist.

Gern nehme ich auch Mitstreiter ins Projektteam auf. Darüber kann man ganz in Ruhe einmal sprechen. Gern auch in einem Telefonat.

Mit freundlichen Grüßen

Failwell
 
Gehe zu:   
 

Impressum · Datenschutzerklärung · Einwilligungen