¿Qué es Cassandra y para que sirve? Aprende a gestionar y crear tablas para tus trabajos

oja que representa el logo de cassandra

Casandra se ha posicionado como una de las aplicaciones que funciona como uno de los medios de comunicación más utilizado del momento e incluso uno de los medios más consultados en el Internet. Puesto a la cantidad de contenido que manipula en  Internet, se le conoce como una biblioteca virtual mundial muy similar a Google Academic o la misma Wikipedia. Por ende, son muchos usuarios que quieren saber el uso y funcionamiento óptimo de Cassandra.

Qué es y Cómo Usar Cassandra

Ahora bien, las empresas u organizaciones tienen la necesidad de manejar una base de datos. Puesto que se usa como almacenamiento, ya que las empresas manejan cantidades grandes de información. Luego, esta información puede ser recogida y descargada por los sistemas de la empresa en particular. Es importante destacar que Cassandra es una base datos que puede organizar toda la información que quieres almacenar para luego utilizar.

Índice()
  1. ¿Qué es Cassandra?
  2. ¿Cuál es el uso y funcionamiento de Cassandra?
    1. ¿Qué ventajas y desventajas tiene Cassandra?
  3. Estructura de Cassandra
    1. Inserción de Datos en Cassandra
  4. Instalación de Cassandra
  5. Uso y funcionamiento de tablas de Cassandra
    1. Con Cláusula
    2. Uso y funcionamiento de Cassandra Alter Table, Drop Table y Truncate Table

¿Qué es Cassandra?

Muchos usuarios no saben mucho sobre este programa, por lo cual se puede tener muchas dudas al respecto sobre que es Cassandra. Desde el punto de vista informático se compone de una o más columnas donde se depositan los datos de información. De tal manera que cada una de las columnas la guardan en cada elemento y las filas de las tablas conforman registros.

Cassandra es un tipo de base de datos NoSQL, siendo de código libre, así que esta data sea distribuida a lo largo de todos los nodos en el clúster. El depósito de Cassandra está formado por llave/valor, precisamente esta llave puede mapear uno o más valores. Es muy similar a las bases de datos MySQL, a las cuales se pueden acceder usando PHP PDO

El desarrollo inicial de Cassandra tiene su origen en Facebook, que lo diseño para potenciar la capacidad de búsqueda en el imbox. Ahora bien, para usar y saber el funcionamiento de Cassandra, es necesario saber que esta es una base de datos, la cual nos brinda nuevas características muy favorecedoras.

¿Cuál es el uso y funcionamiento de Cassandra?

Lo bueno que nos ofrece Cassandra es que podemos mover grandes cantidades de datos de forma rápida y sencilla.  Esta base de datos es comprensiva a fallos, de esta manera los datos se replican de carácter automático. Ya que se diferencian en los centros de datos.

Además, es dispersada, puesto que cada nodo del clúster de base de datos es igual a otros nodos. Ahora bien, los modelos de datos van más allá de los pares de calve y valor. Es flexible porque cuando se lee y se escribe va progresando linealmente al momento de ir añadiéndolo a la computadora. Ahora bien, luego de conocer el uso y funcionamiento de Cassandra y sus características de base de datos, posteriormente es necesario conocer sus ventajas y desventajas.

¿Qué ventajas y desventajas tiene Cassandra?

Está colocado en la parte donde dice columna familias”, ya que esta ventaja es tolerante a las fallas. Debido a que hace una réplica de los datos de forma involuntaria a todos los nodos. En pocas palabras cuando un nodo se daña este automáticamente es reemplazado sin ningún tiempo de inactividad.

Entonces, el hecho de tener los datos almacenados en columna a columna, hace retornar las filas rápidamente. No obstante, este se considera un factor muy débil en la tecnología. Ahora en el momento de insertar, actualizar o incluso borrar un registro este deberá hacer más de una ubicación. La base de datos Cassandra no es recomendable para sistemas de tipo OLTP debido a las transacciones.

Estructura de Cassandra

Primeramente, se encuentra el factor de replicaciónque nos indica el número de nodos que se guardan en la misma fila. Seguidamente se encuentran los Keyspaceaquí nos va a permitir agrupar la información de manera que son contenedores de la aplicación. Cada conjunto de ordenador tiene un keyspace. Sin embargo, se usa para el mando de replicación.

estructura de funcionamiento de cassandra

Ahora bien, en la opción de Column family”, indica que son contenedores iguales para la colección de filas. En tal sentido esto quiere decir que cada fila es una recolección ordenada de columnas. Posteriormente la Estrategia de replicación” contiene dos estrategias para la replicación de información.

Asimismo, una de ellas es la “Simplestrategy” esta se encarga de copiar la información hasta que se cumpla la replicación. Y la siguiente “Networktopologystrategy” considerada la mejor opción para distribuir la información en muchos centros de datos.

Inserción de Datos en Cassandra

En el momento de almacenar los datos en un conjunto de ordenadores, Cassandra lo va a guardar de manera ordenada. Debido a que lo más recomendable es crear una columna familias, las cuales se ordenan con la clave (Row key). Al instante de tener todos los datos ordenados, este aumentará el rendimiento a la hora de realizar las consultas. Lo normal sería tener ordenadas las columnas y ROW por nombre, ya que Cassandra proporciona los compradores.

Instalación de Cassandra

Luego de haber conocido un poco de la arquitectura de Cassandra ahora ya sabemos con qué contamos y que podemos lograr. La instalación de Cassandra la efectuaremos en un equipo con Windows en el cual debemos realizar ciertas exigencias. Lo primero que debemos hacer es tener descargado java 7 en el sistema.

Luego se requiriera Microsoft visual c+ y 2008 Redistributable package (x86). Por último, conexión a Internet para descargar el paquete de datastax. Ahora bien, ya con los requisitos en orden nos dirigiremos a la página del proyecto y se buscarán las versiones, tales como de 32 o 64 bits la cual se adapte al sistema.

Para comenzar con la instalación primero debemos descargar el archivo por el navegador. Una vez descargado el archivo, se procederá instalarlo y aparecerá una ventana donde hay que darle a Siguiente”, seguidamente aparecerá la licencia del producto que se descargó.

Luego se debe escoger la ruta donde se va a instalar o en tal caso se puede dejar la que está por defecto. Sucesivamente aparecerán 2 opciones, que son las de Iniciar automáticamente la data stax y la otra Iniciar automáticamente el ops center”.

Seguidamente presionamos aceptar y esta se instalará, una vez terminada la instalación se abrirá una ventana donde hay dos opciones nuevamente. Asimismo, la primera es para iniciar el “Ops center” y la otra es para “Registra la edición de las datas center”. Finalmente tendremos la base de datos Cassandra descargada.

pagina oficial de descarga de cassandra

Uso y funcionamiento de tablas de Cassandra

Para entender correctamente el uso y funcionamiento de las tablas de Cassandra, tenemos que tener en claro lo que sería la "familia de columnas" que posee, que son similares a las tablas RDBMS o en su defecto al funcionamiento de 4Chan con sus tablas. Estas columnas se utilizan para almacenar datos. El comando "Crear tabla" se usa para crear una familia de columnas en Cassandra.

  • Clave Principal Única (Nombre de Columna)

La clave principal única se especifica mediante la siguiente sintaxis. En la clave principal única, solo hay una columna. Esa columna también se llama clave de partición. Los datos se dividen basándose en esa columna. Los datos se distribuyen en diferentes nodos en función de la clave de partición.

  • Clave Primaria Compuesta (ColumnName1, ColumnName2 ...) y Clave de Partición Compuesta ((ColumnName1, ColumnName2), ColumnName3 ...))

En la sintaxis anterior, "ColumnName1" es la clave de partición y "ColumnName2" es la clave de agrupación en clústeres. Los datos se dividirán con base en ColumnName1 y los datos se agruparán con base en ColumnName2. Y los datos se agruparán con base en la ColumnName3. Si tienes demasiados datos en la partición única. Luego, se utiliza la clave de partición compuesta. La clave de partición compuesta se utiliza para crear varias particiones para los datos.

 

Con Cláusula

Se utiliza para especificar cualquier propiedad y su valor para la tabla definida. Por ejemplo, si desea comprimir los datos de la tabla de Cassandra. Puede establecer la propiedad de compresión especificando el valor de la propiedad del algoritmo de compresión en "Con cláusula". Ejemplo:

  • Aquí está la ejecución del comando "Crear tabla" que creará el nombre de la tabla estudiante en el espacioclave de 'Universidad' con columnas RollNo, nombre y departamento. RollNo es la clave principal.
  • RollNo es también una clave de partición.
  • Todos los datos estarán en la partición única.

Uso y funcionamiento de Cassandra Alter Table, Drop Table y Truncate Table

El comando "Alter Table" se usa para eliminar columnas, agregar una nueva columna, modificar el nombre de una columna, modificar el tipo de columna y cambiar la propiedad de la tabla. El comando "Drop table" elimina la tabla especificada, incluidos todos los datos del espacio de claves. Y por su parte, el comando 'Truncate table" elimina todos los datos de la tabla especificada.

Subir