Red de conocimientos sobre prescripción popular - Conocimientos de oftalmología - ¿Qué herramientas de minería de datos de código abierto existen?

¿Qué herramientas de minería de datos de código abierto existen?

1. RapidMiner

Esta herramienta está escrita en lenguaje Java y proporciona tecnología de análisis avanzada a través de un marco basado en plantillas. La mayor ventaja de esta herramienta es que los usuarios no necesitan escribir ningún código. Se proporciona como un servicio, no como software nativo. Cabe mencionar que esta herramienta ocupa el primer lugar en el ranking de herramientas de minería de datos.

Además, además de la minería de datos, RapidMiner también proporciona funciones como preprocesamiento y visualización de datos, análisis predictivo y modelado, evaluación e implementación estadísticos. Más importante aún, también proporciona escenarios de aprendizaje, modelos y algoritmos de WEKA (un entorno de análisis inteligente) y scripts R.

RapidMiner se publica bajo la licencia de código abierto AGPL y se puede descargar desde SourceForge. SourceForge es un lugar donde los desarrolladores se centran en el desarrollo y la gestión. Aquí se han instalado una gran cantidad de proyectos de código abierto, incluido MediaWiki utilizado por Wikipedia.

2. WEKA

La versión local sin Java de WEKA se utiliza principalmente para analizar datos en el campo agrícola. La herramienta está basada en una versión de Java y es muy sofisticada y se utiliza en muchas aplicaciones diferentes, incluidos algoritmos para análisis y visualización de datos, así como modelado predictivo. La ventaja en comparación con RapidMiner es que es gratuito bajo la Licencia Pública General GNU, ya que los usuarios pueden optar por personalizarlo según sus preferencias.

WEKA admite una variedad de tareas estándar de minería de datos, incluido el preprocesamiento, recopilación, clasificación, análisis de regresión, visualización y selección de características de datos.

WEKA será más potente después de agregar el modelado de secuencias, pero actualmente no está incluido.

3. Programación R

Si te dijera que el proyecto R, un proyecto GNU, está escrito por R (denominado programación R, en adelante R), ¿Qué pensarías? Escritos principalmente en C y FORTRAN, muchos módulos están escritos en R, un software gratuito para computación estadística y gráficos en lenguajes de programación y entornos de software. El lenguaje R se utiliza ampliamente en minería de datos, desarrollo de software estadístico y análisis de datos. La facilidad de uso y la escalabilidad también han aumentado considerablemente la popularidad de R en los últimos años.

Además de datos, también proporciona técnicas estadísticas y de mapeo, que incluyen modelado lineal y no lineal, pruebas estadísticas clásicas, análisis de series temporales, clasificación, recopilación y más.