Zum Data-Mining Programm für Meinungen und Facts
Dieser Text ist im Cache von metaowl.de - das Original ist hier zu finden.
Als Ergänzung zur Heise Meldung Software zur Entdeckung negativer Berichte über die USA gewünscht, die ich gerade auch an die infowar Mailingliste gepostet habe, weil im Zusammenhang mit der "Software" auch die Rede vom Total Information Awareness Programm war:
Ich habe mir vorgestern einige Forschungspapers von den Beteiligten angeschaut, wobei es immer um die gleichen Zielsetzungen und Techniken geht.
Unter den Vorläuferprogrammen gibt es ein Programm mit der Bezeichnung RIPTIDES, das 2001 im Rahmen des DARPA TIDES Projekts gefördert wurde. TIDES war / ist eine Komponente des TIA Projekts.
Das Forschungspaper "Joint Extraction of Entities and Relations for Opinion Recognition" von 2006 beschreibt die Grundlagen des in den Medien thematisierten Programms. Interessant sind auch hier wieder die Sponsoren:
Weblogs auf dem Informationsradar
Immer wieder TIA
Big-Brothers und das Web 2.0
Etwas Googlemining zu Topsail
TIA die Wiederauferstehung, Teil...
Interessant ist auch die Website des Projektleiters Jan Wiebe, der in Kooperation mit den anderen Universitäten als Direktor des Intelligent Systems Programms an der Universität von Pittsburgh an dem angesprochenden Programm mitwirkt und fleißig die Publikationen zum Data-Mining Programm in der Presse und Weblogs sammelt. Dort findet sich auch die Pressemitteilung der Universität von Pittsburgh zum aktuellen Programm vom 3. August 2006 oder der Artikel Can computers have an opinion? von ZDnet, die bereits am 24. September über das Programm berichteten.
Das jetzt vorgestellte Programm ist mit seinen 2,4 Mill. US$ noch als klein einzustufen und nur einer von vielen Ablegern oder Nachfolgern des TIA Projekts für das Data-Mining von Open Source Quellen. Diesmal sind es statt der Weblogs mehr die ausländischen Nachrichtenquellen und vor allem deren Quellen und Meinungsführer. Die Aussage der Projektleiterin Claire Cardie an der Cornell Universität, die Ergebnisse der Forschungsarbeit würden nicht auf E-Mails (oder Weblogs) angewendet und man würde den Datenschutz beachten, kann man im Licht der aktuell bereits laufenden Data-Mining Projekte (s. o.) gelinde gesagt nur als naiv bezeichnen und als Augenwischerei für die aufgeschreckten Medien.
P. S.: Angesichts des Engagement von Google als Mitsponsor derartiger Programme dürfte es nicht verwundern, dass Google irgendwann als zusätzlichen Dienst ein "Wahrheitsrating" anbieten wird, wie man bei Netzpolitik in USA, Google und Meinung & Wahrheit in der Politik erfährt.
Ich habe mir vorgestern einige Forschungspapers von den Beteiligten angeschaut, wobei es immer um die gleichen Zielsetzungen und Techniken geht.
Unter den Vorläuferprogrammen gibt es ein Programm mit der Bezeichnung RIPTIDES, das 2001 im Rahmen des DARPA TIDES Projekts gefördert wurde. TIDES war / ist eine Komponente des TIA Projekts.
Das Forschungspaper "Joint Extraction of Entities and Relations for Opinion Recognition" von 2006 beschreibt die Grundlagen des in den Medien thematisierten Programms. Interessant sind auch hier wieder die Sponsoren:
"We thank the reviewers for their many helpful comments and Vasin Punyakanok for
running our data through his SRL system. This work was supported by the Advanced
Research and Development Activity (ARDA), by NSF Grants IIS-0535099 and
IIS-0208028, and by gifts from Google and the Xerox Foundation."
Bei der ARDA alias dem "Disruptive Technology Office (DTO)" werden (neben dem U. S. Air Force Office of Scientific Research (AFOSR) oder dem Office of Naval Research (ONR) – wenn alle Hinweise zutreffen – die Komponenten oder Teile des TIA Programms weiter fortgeführt und entwickelt:Weblogs auf dem Informationsradar
Immer wieder TIA
Big-Brothers und das Web 2.0
Etwas Googlemining zu Topsail
TIA die Wiederauferstehung, Teil...
Interessant ist auch die Website des Projektleiters Jan Wiebe, der in Kooperation mit den anderen Universitäten als Direktor des Intelligent Systems Programms an der Universität von Pittsburgh an dem angesprochenden Programm mitwirkt und fleißig die Publikationen zum Data-Mining Programm in der Presse und Weblogs sammelt. Dort findet sich auch die Pressemitteilung der Universität von Pittsburgh zum aktuellen Programm vom 3. August 2006 oder der Artikel Can computers have an opinion? von ZDnet, die bereits am 24. September über das Programm berichteten.
Das jetzt vorgestellte Programm ist mit seinen 2,4 Mill. US$ noch als klein einzustufen und nur einer von vielen Ablegern oder Nachfolgern des TIA Projekts für das Data-Mining von Open Source Quellen. Diesmal sind es statt der Weblogs mehr die ausländischen Nachrichtenquellen und vor allem deren Quellen und Meinungsführer. Die Aussage der Projektleiterin Claire Cardie an der Cornell Universität, die Ergebnisse der Forschungsarbeit würden nicht auf E-Mails (oder Weblogs) angewendet und man würde den Datenschutz beachten, kann man im Licht der aktuell bereits laufenden Data-Mining Projekte (s. o.) gelinde gesagt nur als naiv bezeichnen und als Augenwischerei für die aufgeschreckten Medien.
P. S.: Angesichts des Engagement von Google als Mitsponsor derartiger Programme dürfte es nicht verwundern, dass Google irgendwann als zusätzlichen Dienst ein "Wahrheitsrating" anbieten wird, wie man bei Netzpolitik in USA, Google und Meinung & Wahrheit in der Politik erfährt.
von rabenhorst - Owl,
gepostet am Donnerstag, 5. Oktober 2006 um 19:47

