puntuación datos no etiquetados chispa ml

votos
0

Editado: Para los datos con etiqueta, podemos utilizar LabeledPoint para la formación y las pruebas. Sin embargo, si tengo una trama de datos de datos no etiquetados, ¿cuál es la mejor manera de encontrar la probabilidad de que pertenece a qué clase (supongamos clasificación binaria)?

Supongamos que la trama de datos se parece

# De DataPoint | Característica 1 | Característica 2 | ... | Característica 1000 |

mientras que la dimensión de las características es la misma que la de LabeledPoints en formación. Todo el código está en Scala con Spark 2.x.

Publicado el 02/07/2017 a las 18:33
fuente por usuario
En otros idiomas...                            

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more