Ciencia de Datos, conceptos iniciales
Aunque no queria saber nada de Python tuve que tomar un pequeño curso sobre ciencia de datos y estas son las primeras impresiones que tengo al respecto; primero definir que es ciencia de datos es muy complejo, dado que se ha vuelto un termino tan "vacio" y que es repetido hasta el cansancio que me parece se esta volviendo una palabra superflua o un termino de moda para abrir otra carrera en alguna universidad que a su entender piensa que es importante el hablar del tema; segun a lo que llego a entender del termino la ciencia de datos es una exageracion y sobre analisis de la interpretacion de datos que de cierta forma se vuelven cada vez mas importantes estudiarlos y comprenderlos por la cantidad de informacion que hay. un diagrama resumen interesante se halla en el libro de "Python Data Science handbook" de Jake VanderPlas escrito en 2017 en el que ya se habla de lo "mediatico" que se estaba volviendo la ciencia de datos y actualemte en 2023 es que veo la necesidad imperiosa de saber o por lo menos entender algo de lo que es la ciencia de datos, ya que en mi actual trabajo sufrimos de eso que llamaria el complejo de Dios, ya que la cantidad de informacion que se tiene es muy interesante pero debido a que no se sabe como tratar esa informacion solo se conforman "tablas" de consultas y resumenes muy "simples" de lo que realmente se pudiera estudiar con eso datos y tomar descisiones realmente buenas; volviendo al caso; el libro que consulto muestra un diagrama de Venn que indca que es ciencia de datos y creo que es la manera mas simple de definirlo y comprender esta area del tratamiento de la informacion.
El grafico pone a la ciencia de datos en la interseccion entre lo que es un Hacker, un estadista(o persona con conocimientos en estadistica o matematico) y el termino "Substansive Expertise" que seria algo asi como; las habilidades de una persona en algun tema de interes profundo o por lo menos en el que tenga algun dominio especifico; es decir el campo en el que se esta aplicando la ciencia de datos.
Estas implicaciones permiten a los profesionales de muchas ramas el abordar problemas complejos que de otra forma no tendrian como tratarlos; ya que se requiere de un enfoque informado y efectivo de conceptos que resulven desafios y de los cuales salen oportunidades; ya sean por ejemplo en situaciones de saber resultados electorales, pronosticar movimientos en acciones de determinados tipos, buscando pronosticos de futbol, etc. es decir trabajando en cualquier campo; y con esto vuelvo a la primera linea de este blog; "aprender python" no por la necesidad de aprender algo nuevo, sino utilizarlo como herramienta de ciencia computacional por la cantidad de informacion que existe en este lenguaaje; ya sea con IPython, NumPy, Pandas, Matploitlib, etc. que son herramientas relacionadas para almacenar, manipular y obetener la informacion de forma eficaz.
Python surge como herramienta principal para investigacion cientifica y tareas informaticas, incluidas el analisis y visualizacion de grandes cantidades de informacion; ya que especialmente fue diseñado para esto, ya sea por (cito textualmente) su sintaxis clara, la cantidad de bibliotecas y frameworks, la gran comunidad de usuarios y su integracion con diferentes tecnologias.Python no es perfecto pero es ideal para hacer este tipo de programas, pero mas que manejar un lenguaje de programacion se necesita de un manejo numerico, extraer estos datos que son valiosos requieren de matematicas y del conocimiento estadistico basico como la "media", "desviacion estandar", etc. por tanto este reto se debe de enfocar desde un reto personal centrandoce en estos concepto.