Hans Uszkoreit (Biography) Q.1, 2nd theme

30 03 2008

As Hans Uszkoreit curriculum vitae said, he is Professor of Computational Linguistics at Saarland University. At the same time he serves as Scientific Director at the German Research Center for Artificial Intelligence (DFKI) where he heads the DFKI Language Technology Lab. By cooptation he is also Professor of the Computer Science Department.

Us<koreit studied Linguistics and Computer Science at the Technical University of Berlin and the University of Texas at Austin. During his time in Austin he also worked as a research associate in large machine translation project at the Linguistics Research Center. In 1984 Uszkoreit recieved his Ph.D. in linguistics from the University of Texas. From 1982 until 1986, he worked as a computer scientist at the Artificial Intelligence Center of SRI International in Menlo Park, Ca. During this time he was also affiliated with the Center for the Study of Language and Information at Stanford University.

Finally, his current interests are computer models of natural lagunage understanding and production, advanced applicationsof language and knowledge technologies such as semantic information systems, cognitive foundations of language and knowledge, grammar formalisms and their implementation, syntax and semantics of natural language and the grammar of German.

Here we have his Recent Publications:

*Uszkoreit H.(2007) Methods and Applications for Relation Detection. In: Proceedings of the Third IEEE International Conference on Natural Language Processing and Knowledge Engineering, Beijing, 2007.

*Uszkoreit H. F. Xu, W. Liu (2007) Challenges and Solutions of Multilingual and Translingual Information Service Systems, To appear in Proceedings of HCI International 2007, 12th International Conference on Human-Computer Interaction, Beijing, 2007.

*Uszkoreit, H., F. Xu, Weiquan Liu, J. Steffen, I. Aslan, J. Liu, C. Müller, B. Holtkamp, M. Wojciechowski (2007)
A Successful Field Test of a Mobile and Multilingual Information Service System COMPASS2008. In Proceedings of HCI International 2007, 12th International Conference on Human-Computer Interaction, Beijing, 2007.
* Xu F., H. Uszkoreit, Xu F., H. Li (2007) A Seed-driven Bottom-up Machine Learning Framework for Extracting Relations of Various Complexity, To appear in: Proceedings of ACL 07, Annual Meeting of the Association of Computational Linguistics, Prague 2007.

*Frank, A., H.-U. Krieger, F. Xu, H. Uszkoreit,B. Crysmann, B. Jörg, U. Schäfer (2007) : Question Answering from Structured Knowledge Resources. In: Journal of Applied Logic, Volume 5, Issue 1, March 2007, Pages 20-48.


* Hans Uszkoreit publications, retrieved March 27 (2008), from http://www.coli.uni-saarland.de/~hansu/hucv_eng.pdf

* Hans Uszkoreit Curriculum Vitae, retrieved March 27 (2008), from http://www.coli.uni-saarland.de/~hansu/bio.html



9 02 2008
An e-book is a text stored in a digital way which can be copied and read in a PC, or in a recent portable devices for eBooks. These books can be read by programs which are called readers.There are basically two steps to build an eBook: prepare the content for conversation, and choose a tool for conversation to Microsoft Reader. All conversation tools require that you have a clean HTML file and marked a sane with the standards defined by the Open eBook Foundation. For more details on these standards visit the Web Open eBook. You can create an eBook in a short space of time (2 or 3 hours) if they have prepared all the necessary parts. Among the items needed include images JPEGs for Home and the Library, as well as other elements that may need eBook. To get more information on the elements of an eBook see Guides Source Materials and Source Materials Conversion Guide and Conversion Guide available for downloading from the same site and included in Content SDK.

To read eBooks in a PC or poket PC, we have to use a reader program. Nowadays there are two readers available: Microsoft Reader and Glassbook Reader. These programs let us adjust the typography, turn on the pages, use pointers, insert notes, bring texts out , and many other functions necessaries for readding. The books are downloaded from Internet, or can be generated by ourselves. Glassbook read files on PDF; and Microsoft Reader, files on .LIT or Reader which fulfil with OEB rules. These last take up less space than PDF ones. Microsoft give us free machines to turn Word files into Reader, and ReaderWorks company offers machines to turn HTML into Reader. These tools makes very easy turn on Word or HTML files on eBooks.


Web 2.0

9 02 2008

 Web 2.0 is the business revolution in the computer industry caused by the move to the Internet as platform, and an attempt to understand the rules for success on that new platform.

The concept of “Web 2.0” began with a conference brainstorming session between O’Reilly and MediaLive International. Dale Dougherty, web pioneer and O’Reilly VP, noted that far from having “crashed”, the web was more important than ever, with exciting new applications and sites popping up with surprising regularity. What’s more, the companies that had survived the collapse seemed to have some things in common. Could it be that the dot-com collapse marked some kind of turning point for the web, such that a call to action such as “Web 2.0” might make sense? We agreed that it did, and so the Web 2.0 Conference was born.

In the year and a half since, the term “Web 2.0” has clearly taken hold, with more than 9.5 million citations in Google. But there’s still a huge amount of disagreement about just what Web 2.0 means, with some people decrying it as a meaningless marketing buzzword, and others accepting it as the new conventional wisdom.

This article is an attempt to clarify just what we mean by Web 2.0.

In our initial brainstorming, we formulated our sense of Web 2.0 by example:

Web 1.0   Web 2.0
DoubleClick –> Google AdSense
Ofoto –> Flickr
Akamai –> BitTorrent
mp3.com –> Napster
Britannica Online –> Wikipedia
personal websites –> blogging
evite –> upcoming.org and EVDB
domain name speculation –> search engine optimization
page views –> cost per click
screen scraping –> web services
publishing –> participation
content management systems –> wikis
directories (taxonomy) –> tagging (“folksonomy”)
stickiness –> syndication

The Web As Platform:




25 01 2008

 Timothy “Tim” John Berners-Lee  y su grupo desarrollaron lo que por sus siglas en inglés de denominan Lenguaje HTML (HyperText Markup Language) o el Lenguaje de Etíquetas de Hipertexto; el protocolo HTTP (HyperText Transfer Protocol); y el sistema de localización de objetos en la web URL (Universal Resource Locator).

 Tal y como dice la web de wikibipedia, HTML es el acrónimo inglés de HyperText Markup Language, que se traduce al español como Lenguaje de Etiquetas de Hipertexto[1] . Es un lenguaje de marcado diseñado para estructurar textos y presentarlos en forma de hipertexto, que es el formato estándar de las páginas web. Gracias a Internet y a los navegadores como Internet Explorer, Opera, Firefox, Netscape o Safari, el HTML se ha convertido en uno de los formatos más populares y fáciles de aprender que existen para la elaboración de documentos para web.

HTML no es un lenguaje de programación, aunque si permite incluirle código en lenguajes de programación, bajo ciertos criterios, extendiendo su capacidad y funcionalidad, aunque eso se logre excediendo los alcances del HTML en si.

Por otra parte, la mayoría de las etiquetas del lenguaje html son semánticas. La interpretación de las etiquetas es realizada por el navegador web. El lenguaje HTML es extensible, se le pueden añadir características, etiquetas y funciones adicionales para el diseño de páginas web, generando un producto vistoso, rápido y sencillo.

Etiquetas: Un lenguaje de etiquetas es un conjunto de palabras o caracteres que se colocan junto al texto de un documento para especificar una propiedad del mismo. 

Tipos de etiquetas: físicas y semánticas. Las etiquetas físicas son las que tienen una función de estilo determinado mientras que las semánticas son etiquetas equivalentes a las físicas pero que se definen mediante un lenguaje coloquial, como la etiqueta strong del ejemplo. Con ambas se logran los mismos resultados.



25 01 2008
XML, sigla en inglés de Extended Markup Language («lenguaje de marcas extensible»), es un metalenguaje extensible de etiquetas desarrollado por el World Wide Web Consortium (W3C). Es una simplificación y adaptación del SGML y permite definir la gramática de lenguajes específicos. Se puede usar en bases de datos, editores de texto, hojas de cálculo y casi cualquier cosa imaginable.Su desarrollo se comenzó en 1996 y la primera versión salió a la luz el 10 de febrero de 1998. La primera definición que apareció fue: Sistema para definir validar y compartir formatos de documentos en la web. Durante el año 1998 XML tuvo un crecimiento exponencial, con apariciones en medios de comunicación, menciones en páginas web, soporte software, etcCaracterísticas generales.

  • Directamente utilizable en Internet
  • Soporte para una amplia variedad de aplicaciones para transferencia de datos
  • Compatible con SGML
  • Posibilidad de crear sencillos procesadores de XML
  • Documentos XML legibles y medianamente claros (depende de la definición)
  • Diseño rápido del lenguaje
  • Simple, pero perfectamente formalizado
  • Documentos XML fáciles de crear

Es importante mencionar, por último, las ventajas que ha supuesto la creación del XML:

  • Es extensible, lo que quiere decir que una vez diseñado un lenguaje y puesto en producción, igual es posible extenderlo con la adición de nuevas etiquetas de manera de que los antiguos consumidores de la vieja versión todavía puedan entender el nuevo formato.
  • El analizador es un componente estándar, no es necesario crear un analizador específico para cada lenguaje. Esto posibilita el empleo de uno de los tantos disponibles. De esta manera se evitan bugs y se acelera el desarrollo de la aplicación.
  • Si un tercero decide usar un documento creado en XML, es sencillo entender su estructura y procesarlo. Mejora la compatibilidad entre aplicaciones

Las consecuencias inmediatas del sistema que tratamos son la aparición de la Web 2.0, o el desarrollo de sistema como por ejemplo el TEI.


Oralidad, escritura e hipermedios

3 01 2008
La oralidad es una forma comunicativa que va desde el grito de un recién nacido hasta el diálogo generado entre amigos. Existen dos clases de oralidad: La primaria, que se refiere a las culturas que sólo la poseen a ella para comunicarse y que permite una activación de la memoria. Y la oralidad secundaria, ésta es la que manejan culturas avanzadas que poseen escritura, y se ha convertido en soporte de la memoria. Es de gran interés el estudio de la oralidad efectuado por Walter J. Ong, “Algunas psicodinámicas de la oralidad”, en W. J. Ong [1982], Orality and Literacy. The technologizing of the Word. Así como las palabras de E. A. Havelock [1986], La musa aprende a escribir. Reflexiones sobre oralidad y escritura desde la Antigüedad hasta el presente.La escritura es un sistema de representación gráfica de una lengua, por medio de signos grabados o dibujados sobre un soporte. Es un método de intercomunicación humana que se realiza por medio de signos visuales que constituyen un sistema. La escritura ha evolucionado a través del tiempo. Fundamentalmente ha sido de dos maneras:

  • Ideográficamente: cuando se expresan las ideas.
  • Fonéticamente: cuando se representan los sonidos.

En cuanto a los hipermedios, primero debemos definir el concepto de “medios” (media en inglés) y después el de “hipertexto”. Pues bien, “media” es la más básica tecnología de comunicación y almacenamiento de información, incluye a los lenguajes humanos como la música, la pintura y el cine. Hipertexto es un término usado para indicar las conexiones entre los documentos de naturaleza textual e hipermedios se refiere a la conexión entre los documentos de diversos tipos de medios [Dale, 1997]. El texto, los gráficos, el audio y el video pueden ahora estar en vivo de forma unificada, respondiendo a las nuevas necesidades que tenemos con las diferentes formas de expresar la información [Nelson, 1987].


Libro Digital

9 11 2007

Antiguamente la lectura era poco común, la gente no sabia leer ni escribir, pero al paso del tiempo algunos escritores han ido redactando leyendas, historias fantásticas y varios manuscritos.

Se puede decir que la lectura ha ido evolucionando de una manera lenta pero constante.La gente hoy en día suele leer mucho, se informan a través del periódico, de libros, revistas…. Y eso hace que la tenga ideas para crear nuevas tecnologías, como es en este caso el libro digital.

Últimamente, el libro digital está teniendo mucho éxito ya que todo el mundo se mete a internet para cualquier cosa.

E aquí una breve explicación de lo que es:

“Un libro digital es cualquier texto almacenado en formato digital que se puede copiar y leer en una PC, computadora portátil o los recientes dispositivos portables de eBook. Estos libros se pueden leer mediante programas denominados lectores.”

Por otra parte tiene varias ventajas:

· Fáciles de conseguir

· Portables

· Versátiles

· Pequeños

Por otra parte, “Los libros digitales están disponibles en todas las categorías y géneros, desde los best-sellers hasta los clásicos. Aunque por ahora la mayoría están en inglés es de esperar que a fines de 2000 haya muchos en castellano.”

Esperemos que poco a poco de esta forma alimentemos más nuestra mente con la lectura.