Modelo de datos semiestructurados

Datos no estructurados
Los datos semiestructurados son datos que no se ajustan a las normas de los datos estructurados tradicionales, sino que contienen etiquetas (tags) u otros tipos de marcas que identifican entidades individuales y distintas en los datos.
Si los datos son complejos o si un valor individual requiere más de 16 MB de espacio de almacenamiento, puede utilizar más de una de las técnicas anteriores. Por ejemplo, puede dividir los datos en varias columnas, y algunas de estas columnas pueden contener una jerarquía explícitamente especificada de tipos de datos.
Ejemplo de datos estructurados y no estructurados
Una línea de dirección, por ejemplo: 25 rue du Général de Gaulle. La entienden perfectamente los humanos, que podrán encontrarla en la ciudad. En realidad se compone de tres elementos: el número, el tipo de calle y el nombre de la calle. Para clasificar los datos en función de la dirección, será necesario separar estos tres elementos: identificar el nombre de la calle, separar la "calle" y la "avenida" de la General de Gaulle, y después clasificar por número. Estas etapas consisten en transformar los datos semiestructurados de la línea de dirección en una secuencia de tres datos estructurados (véase este término).
Ejemplo de datos no estructurados
XML es el estándar más adecuado para manejar datos semiestructurados, ya que ofrece la posibilidad de anotar información sin tener que utilizar un esquema estructurado y restrictivo.Ejemplos de datos semiestructurados
Un particular o una empresa también pueden crear una base de datos semiestructurada introduciendo una lista de contactos en un procesador de textos y separando los datos personales, como el nombre, la dirección postal o el número de teléfono, mediante una simple coma o tabulación.
Definición de datos estructurados
En el pasado, los datos no estructurados solían infrautilizarse debido a las dificultades de interpretación que entrañaban. Las nuevas tecnologías han permitido no sólo comprender mejor esta valiosa masa de datos, sino también extraer de ella información estratégica.
Para los datos no estructurados se utilizan generalmente bases de datos NoSQL. NoSQL significa "no sólo SQL", lo que indica que la base de datos es capaz de manejar una gama de datos más amplia que las bases de datos SQL. Las bases de datos NoSQL no tienen una estructura esquemática o tabular; son sólo una colección de datos agrupados.