25-04-2020, 05:59 PM
Tengo un fichero .csv con 16 mil filas y 15 columnas... de este fichero cojo sólo la Licencia que no es más que un identificador de producto y la fecha asociada a cada una de ellas.
LICENCIA FECHA
FE-101 01/09/19 00:10
FE-145 03/09/19 04:11
FE-162 04/09/19 05:46
FE-139 05/09/19 08:56
FE-156 07/09/19 09:10
FE-162 10/09/19 20:45
FE-159 12/09/19 21:23
FE-162 25/09/19 22:23
.
.
.
etc.. etc..
después de aplicar groupby + apply + np.array mi salida en consola es algo así... que es justo lo que yo quiero... primera columna toda la lista de identificadores ordenados como etiqueta o encabezado de fila (ahora aparece sólo una vez y las filas se reducen a 64) y a continuación en una única fila las 16 mil fechas asociadas a cada uno de ellos en unos hai 100 fechas y en otros 500 fechas.
FE-101 [01/09/19 15:35, 01/09/19 16:45, 01/09/19 16:5...
FE-102 [01/09/19 05:44, 01/09/19 06:07, 01/09/19 06:1...
FE-103 [02/09/19 08:05, 02/09/19 08:16, 02/09/19 08:4..
.
.
.
FE-188 [01/09/19 15:35, 01/09/19 16:45, 01/09/19 16:5...
FE-189 [01/09/19 05:44, 01/09/19 06:07, 01/09/19 06:1...
FE-190 [02/09/19 08:05, 02/09/19 08:16, 02/09/19 08:4...
Name: FECHA, dtype: object>
Lo que no consigo es que al exportarlo a .csv o txt se mantenga ese formato. Cuando abro el fichero exportado se muesta
FE-101 fecha 1 fecha 2 fecha 3 fecha 4
fecha 5 fecha 6 fecha 7 fecha 8
.
.
.
FE-102 .....
y así hasta completar las fechas de ese identificador
a continuación sigue con el resto de identificadores siempre así identificador cuatro fechas y salto de carro y otras cuatro...
yo quiero identificador Y a continuación todas sus fechas separadas por comas y asi todas las filas. He probado varias cosas pero no me sale y no sé exactamente que buscar para conseguirlo
datos = pd.read_csv('s201909.csv',usecols=['LICENCIA', 'FECHA'], encoding = 'utf-8')
# otras operaciones y me quedo con un DataFrame llamado : nuevo
datfra = pd.DataFrame(nuevo)
# aplico groupby y apply y ningún error
datfra = datfra.groupby('LICENCIA')['FECHA'].apply(np.array)
# consigo hacer la exportación con varias instrucciónes pero ninguna me da el formato de salida que quiero
LICENCIA FECHA
FE-101 01/09/19 00:10
FE-145 03/09/19 04:11
FE-162 04/09/19 05:46
FE-139 05/09/19 08:56
FE-156 07/09/19 09:10
FE-162 10/09/19 20:45
FE-159 12/09/19 21:23
FE-162 25/09/19 22:23
.
.
.
etc.. etc..
después de aplicar groupby + apply + np.array mi salida en consola es algo así... que es justo lo que yo quiero... primera columna toda la lista de identificadores ordenados como etiqueta o encabezado de fila (ahora aparece sólo una vez y las filas se reducen a 64) y a continuación en una única fila las 16 mil fechas asociadas a cada uno de ellos en unos hai 100 fechas y en otros 500 fechas.
FE-101 [01/09/19 15:35, 01/09/19 16:45, 01/09/19 16:5...
FE-102 [01/09/19 05:44, 01/09/19 06:07, 01/09/19 06:1...
FE-103 [02/09/19 08:05, 02/09/19 08:16, 02/09/19 08:4..
.
.
.
FE-188 [01/09/19 15:35, 01/09/19 16:45, 01/09/19 16:5...
FE-189 [01/09/19 05:44, 01/09/19 06:07, 01/09/19 06:1...
FE-190 [02/09/19 08:05, 02/09/19 08:16, 02/09/19 08:4...
Name: FECHA, dtype: object>
Lo que no consigo es que al exportarlo a .csv o txt se mantenga ese formato. Cuando abro el fichero exportado se muesta
FE-101 fecha 1 fecha 2 fecha 3 fecha 4
fecha 5 fecha 6 fecha 7 fecha 8
.
.
.
FE-102 .....
y así hasta completar las fechas de ese identificador
a continuación sigue con el resto de identificadores siempre así identificador cuatro fechas y salto de carro y otras cuatro...
yo quiero identificador Y a continuación todas sus fechas separadas por comas y asi todas las filas. He probado varias cosas pero no me sale y no sé exactamente que buscar para conseguirlo
datos = pd.read_csv('s201909.csv',usecols=['LICENCIA', 'FECHA'], encoding = 'utf-8')
# otras operaciones y me quedo con un DataFrame llamado : nuevo
datfra = pd.DataFrame(nuevo)
# aplico groupby y apply y ningún error
datfra = datfra.groupby('LICENCIA')['FECHA'].apply(np.array)
# consigo hacer la exportación con varias instrucciónes pero ninguna me da el formato de salida que quiero