Proyecto de Data Science con Python - Proyecto Completo Desde 0

🔥 Curso Completo de Data Science en Python: www.udemy.com/course/curso-co...
En este video vamos a resolver un proyecto de Python donde usaremos varias técnicas usadas en el análisis de datos y data science.
🔗 Link para mundiales desde 1930-2018: en.wikipedia.org/wiki/2014_FI...
🔗 Link para mundial 2022 (con datos antes de iniciar el mundial): web.archive.org/web/202211150...
👨🏻‍💻 Código y/o dataset usado en este video: github.com/ifrankandrade/fifa...
🔗 Link de datasets (2da opcion): drive.google.com/drive/folder...
🎮 Discord (aquí puedes descargar mi formulario de Python): / discord
💰 Make money using your Programming & Data Science skills: codelessearnmore.teachable.co...
✅ Sígueme en Medium: / frank-andrade
--------------------
Contenido del video:
0:00 Intro
0:40 Extracción de tablas de los grupos A-H
18:23 Extracción de partidos de futbol - Parte 1
50:34 Extracción de partidos de futbol - Parte 2
01:34:55 Limpieza y Transformación de datos
02:15:42 Elaboración del modelo

Пікірлер: 99

  • @thepycoachES
    @thepycoachES Жыл бұрын

    Observación: Al iniciar el mundial, la página de Wikipedia se va a actualizar con los resultados finales de los partidos del mundial 2022. En caso deseen extraer la data tal y como aparece en el video, usen esta página: web.archive.org/web/20221115040351/en.wikipedia.org/wiki/2022_FIFA_World_Cup 🔥 Curso Completo de Data Science en Python: www.udemy.com/course/curso-completo-de-data-science-en-python-desde-cero-2022/?couponCode=D0EF9355A745E67AE09A

  • @francipecino7719
    @francipecino7719 Жыл бұрын

    En la pagina tal y como esta ahora, los grupos se encuentran en el rango range(12,68,7). Estuvo muy entretenido el video, ahora a animarse a ver mas modelos y a intentarlo hacer con mas caracteristicas en los datos e implantando modelos y redes neuronales de Machine Learning e Inteligencia Artificial. Este video ha sido estupendo para empezar a dar unos primeros pasos y empezar a tener unos enfoques de como hacerlo. Gracias

  • @aldotb
    @aldotb Жыл бұрын

    Muy bien..muy..bien.... Hay futuro como divulgador científico.... Conciso, práctico...,. Directo sin nada de relleno ni nada flow.... Que usan otros.... Like ,me suscribo...click... Campanita y toda esa weaaaaa que hay que hacer.... Felicitaciones...

  • @A4O_TSL
    @A4O_TSL Жыл бұрын

    Muchisimas gracias por este curso, lo voy a estar siguiendo y realizando. Muchas gracias!!!!

  • @ingluissantana
    @ingluissantana Жыл бұрын

    que genial se ve este video.. voy a intentar seguirlo!! :D

  • @antoniogomez-rguez1038
    @antoniogomez-rguez1038 Жыл бұрын

    Muchas gracias por el desarrollo de este proyecto!

  • @ssagredo13
    @ssagredo133 ай бұрын

    Muy bueno, preciso en la hora y media que llevo. Excelencia para explicar.

  • @MrZenther
    @MrZenther Жыл бұрын

    Gracias por compartir, existen varias oportunidades de mejora, sobre todo desde el punto de vista de: la cultura habla hispana, la ciencia de datos y las estadísticas y probabilidades aplicadas al futbol, quedo a la orden para compartir mi ángulo.

  • @dani.cortez
    @dani.cortez7 ай бұрын

    Muy buen video entendible para alguien que recien inicia

  • @gdv338
    @gdv3386 ай бұрын

    Me ha encantado este mini-curso de Data Science desde cero a la final del Mundial de 2022. Me ha servido para tener un primer contacto real con el mundo del Data Science y con el incentivo de conocer la predicción del Mundial, doble motivación. No se puede pedir más por menos. Muchísimas gracias!!

  • @j.carlosvallem.9957
    @j.carlosvallem.9957 Жыл бұрын

    Muchas gracias por el video , a echarle ganas para ser un buen CWI mañana voy a twilight a ver si aplicó gracias !!

  • @DarkCirer
    @DarkCirer Жыл бұрын

    Excelente aporte! No hay mas que decir...

  • @2u15A
    @2u15A Жыл бұрын

    Genial, pude hacerlo todo!

  • @licantropofilms8420
    @licantropofilms8420 Жыл бұрын

    Estuvo muy bueno el video!!!! casi le atinabas en la final jajaja

  • @JORDAN7514
    @JORDAN7514 Жыл бұрын

    Increible, muchas gracias

  • @guidadelac95
    @guidadelac95 Жыл бұрын

    Este canal vale oro puro. Eres todo un crack amigo. ¡Gracias!

  • @guidadelac95

    @guidadelac95

    Жыл бұрын

    Los que tienene problemas para hacer el for por la actualizacion de las tablas, tan solo tienen que cambiar los parametros range (12, 67, 7)

  • @Tobilloquebrado
    @Tobilloquebrado Жыл бұрын

    genial, buen trabajo

  • @diegotinjaca323
    @diegotinjaca3236 ай бұрын

    Excelente,muchas gracias hermano ud habla en Python gracias

  • @dfaquino
    @dfaquino Жыл бұрын

    La verdad espero algún día llegar a ese nivel...

  • @Neurofilia
    @Neurofilia Жыл бұрын

    Tu canal es oro molido, el contenido que haces me ayuda a sintetizar y sentar todo lo que he estado aprendiendo en cursos de diferentes partes. Gracias por compartir este conocimiento tan valioso !

  • @devdev2088

    @devdev2088

    Жыл бұрын

    Oro en barra vale mas😂😂

  • @guidocefe668
    @guidocefe668Ай бұрын

    Excelente trabajo felicitaciones.

  • @goldenjmo
    @goldenjmo Жыл бұрын

    Hola excelente video, estoy intentanto hacer este proyecto un poco distinto pero con los resultados actuales de los grupos de la europa league. Tengo un problema que me impide tomar todos los grupos en un solo dataframe, sino en 8 df. Espero no tener problemas con eso jajaja

  • @victoroliveroing
    @victoroliveroing Жыл бұрын

    Excelente video.

  • @slacex
    @slacex11 ай бұрын

    Saludos desde Chile!!

  • @gabrielroomvm6209
    @gabrielroomvm6209 Жыл бұрын

    BUENISIMO

  • @nahuellopez1272
    @nahuellopez1272 Жыл бұрын

    Muy bueno tu video y muy util, una consulta, recomiendas estudiar en algun lugar en especial? Muchas Gracias

  • @nav7709
    @nav77094 ай бұрын

    GRANDIOSOOO

  • @MrZenther
    @MrZenther Жыл бұрын

    Agregaría valor indicar cuales son los aspectos a considerar, para que una data esté limpia.

  • @rafaeldickens
    @rafaeldickens Жыл бұрын

    1:49:04 ¿valdría la pena haber ordenado también por el index como segundo criterio para no no perder el orden real de los partidos?

  • @EmilianoEmanuelSosa
    @EmilianoEmanuelSosa Жыл бұрын

    Chicos, si extrajeron la data con beautifulsoup, al parecer wikipedia arreglo las clases de las etiquetas, asi que funciona igual con beatifulsoup que con selenium. yo me di cuenta despues de hacer las dos! jaja

  • @hi-io
    @hi-io Жыл бұрын

    🐂 Buen video

  • @nicolascortes8157
    @nicolascortes815710 ай бұрын

    Es muy bueno, lastima que ganamos el mundial nosotros (Arg) pero si fue contra Francia. jajaj Sos crack

  • @maudelaossa
    @maudelaossa Жыл бұрын

    Cordial saludo @thepycoach . Cual seria el valor aproximado a cobrar en USD por un proyecto como este del video para una empresa o un particular. PD Es en general la pregunta independientemente de el tema o el fin con que se hizo el proyecto.

  • @Virus-mx4ft
    @Virus-mx4ft Жыл бұрын

    tu modelo predice que Francia estuvo en la final, eso es increíble.

  • @user-os5zb9ev9s
    @user-os5zb9ev9s6 ай бұрын

    Gran trabajo. Podria hacer la limpieza de datos en Excel?

  • @alejandroisai1885
    @alejandroisai18854 ай бұрын

    Hola! Cuales plugins tienes en pycharm para ver el csv con colores?

  • @elmariscal5394
    @elmariscal53944 ай бұрын

    El throughput también es importante leerlo. Quiere decir con la configuración que le diste cuantos requests por segundo pudo procesar. Analizar el throughput podes ver donde está el cuello de botella o cuánto soporta. El desvío standard también: es cuán variables fueron esas respuestas. Si tiende a un número bajo esta ok y si se va muy arriba ya es muy variable las respuestas. Sds

  • @brianarmasquintana9363
    @brianarmasquintana93633 күн бұрын

    Hola, en la parte de testear que todo lo del driver funciona, sólo me abre el navegador en blanco del chrome testing diciendo que esta versión es sólo para pruebas automatizadas, pero no me redirige a la página web.

  • @TomiADP
    @TomiADP Жыл бұрын

    Dato curioso: en el mundial del 34 los cuartos de final entre Italia y España se jugo con dos partidos: el primero fue empate 1-1 y el segundo (que fue una especie de desempate o "replay") lo ganó la azzurra 1-0.

  • @sombrio2280
    @sombrio2280 Жыл бұрын

    wow bro

  • @luisenriquezamoraglez3124
    @luisenriquezamoraglez3124 Жыл бұрын

    Saludos profesor. Gracias a sus videos me interesé mucho por la Ciencia de Datos, pero también me gusta JavaScript, pues tengo experiencia. ¿Cómo puedo vincular ambas tecnología?

  • @horcasvencer

    @horcasvencer

    Жыл бұрын

    Olvidate de JavaScript, la IA usa librerias de Python, Numpy, Pandas, MatplotLib, SkLearn, Scypy, Google TensorFlow, y Algebra Lineal, Calculo, Probabilistica y Estadistica.

  • @Yoyivd
    @Yoyivd Жыл бұрын

    TIE tiene consignado autorizado para trabajar, fue otorgado en agosto/22, son estudios superiores oficiales. ¿puedo trabajar a tiempo parcial mientras espero respuesta de solicitud de prórroga?

  • @Martin-pb3hx
    @Martin-pb3hx4 ай бұрын

    al concatenar las tablas df_home y df_away las columnas the goals conceded y goals scored tienen diferente posicion, no afecta eso a la hora de efectuar el promedio? como que al juntar las dos tablas la columna de conceded the df_away quedara debajo de la de scored de df_home saludos

  • @rodolfolopezp
    @rodolfolopezp24 күн бұрын

    Costa Rica en su primer Mundial, Italia 90, pasó a segunda ronda, venciendo a Escocia y Suecia. mmm 🤔

  • @alejandrocastro4354
    @alejandrocastro4354 Жыл бұрын

    Tengo problemas en separar las columnas 2:02:50 , solo me devuelve una columna en vez de 2... Alguien sabe por qué? Saludos.

  • @ivanguiscafre
    @ivanguiscafre Жыл бұрын

    A mi la tabla del Grupo A no me aparece, la busque uno a uno y obviamente en el 11 no me salio, puedo visualizar recien la B en el 18

  • @elwata
    @elwata Жыл бұрын

    Hola, todo bien, pero al momento de querer visualizar los archivos exportados con pickle, me sale : Dict_tablas is not UTF-8 encoded saving disabled See console for more details. y si lo quiero abrir con block de notas u otro programa sale caracteres raros.

  • @JOSEALONSO-ti2id
    @JOSEALONSO-ti2id Жыл бұрын

    Que genial el video! Creo que no está jalando el cupon de udemy, me confirmas por favor Éxirtos !

  • @thepycoachES

    @thepycoachES

    Жыл бұрын

    Hola. Si, disculpa. Se me olvido actualizar. Ya están los links de los 3 cursos con el descuento en la descripción.

  • @JOSEALONSO-ti2id

    @JOSEALONSO-ti2id

    Жыл бұрын

    @@thepycoachES Comprado 👍🏻

  • @diegotinjaca323
    @diegotinjaca3236 ай бұрын

    Como elimino palabras,caracteres alfanumericos de una celda de un DataFrame de Pandas?, es un archivo de 8000 mil filas aproximadamente x 8 columnas

  • @cesarelocran
    @cesarelocran3 ай бұрын

    🎉🎉🎉

  • @felipegarcia7181
    @felipegarcia7181 Жыл бұрын

    excelente el modelo, solo le agregaría una ponderación que de mayor peso a los promedios de los mundiales más actuales, con el objetivo de corregir el pasó de los años, por ejemplo hungria antes era bueno ahora no tanto.😅

  • @felipegarcia7181

    @felipegarcia7181

    Жыл бұрын

    también se podría ajustar el modelo dándole una ponderación a los promedios históricos de cada equipo de acuerdo al ranking fifa actual antes de empezar el mundial.😊

  • @rickramper2923
    @rickramper2923 Жыл бұрын

    I was ready to get a virus on my pc lol, but it actually worked!

  • @2u15A
    @2u15A Жыл бұрын

    gracias por el video, la pagina de wiki va actualizando, como se puede hacer un metodo para inspeccionar el nombre de las tablas? gracias nuevamente

  • @thepycoachES

    @thepycoachES

    Жыл бұрын

    Simplemente usa el link de wikipedia que está en la descripción. Es el link “web archive” el cual muestra Wikipedia tal y como estaba cuando grabe el video.

  • @2u15A

    @2u15A

    Жыл бұрын

    @@thepycoachES lo hice pero no funcionó , de todos modos pude resolverlo, el bucle "for" debe hacerse desde 13 a 67, en pasos de 7 tal como lo hiciste en el video. Gracias!

  • @gbertellabertella703
    @gbertellabertella7035 ай бұрын

    Hola me encanto el video! Pero no puedo seguir resulta que el navegador(Google) que tengo justamente no es compatible con ninguno de chrome drive . de hecho en la pagina aparece en rojo... que se hace en este caso ? tengo que esperar a que chromedriver repare el problema ? = (

  • @benito.sistemas1481
    @benito.sistemas14818 ай бұрын

    Este proyecto en cual de tus cursos lo encuentro

  • @TheFrank2189
    @TheFrank2189 Жыл бұрын

    hola estoy por iniciar este ejercicio, pero se me vino la interrogante si cabe la posibilidad de utilizar el visual code como interprete de python o es posible que existan algunos errores con las librerias o la sintaxis de VC

  • @crlosyepez

    @crlosyepez

    Жыл бұрын

    puedes usar jupyter en vcode

  • @rafaelborda6422
    @rafaelborda6422 Жыл бұрын

    Buenas, pregunta...de que depende que usemos pandas para leer el html a usar BeautifulSoup? Gracias!

  • @vergnungungspark2386

    @vergnungungspark2386

    Жыл бұрын

    Leer el html te sirve para cuando las páginas tienen la informacion condensada (como tablas en el archivo de Wikipedia)

  • @rafaelborda6422

    @rafaelborda6422

    Жыл бұрын

    @@vergnungungspark2386 genial amigo gracias por responder ahora otra duda jaja…si no es de forma condensada de que otra puede ser?

  • @mi-laiyamamoto1350
    @mi-laiyamamoto1350 Жыл бұрын

    Me encantó el proyecto, excelente video, quiero realizarlo pero no puedo extraer la base de datos con el nuevo link, me sale error. ¿Hay alguna otra manera de extraer lo datos?

  • @nelsongonzalez6735

    @nelsongonzalez6735

    Жыл бұрын

    utiliza el link que esta en la descripcion y cuando estes extrayendo las tablas empieza desde la 12 y asi como explica el video

  • @ianparra.Taylors_Version
    @ianparra.Taylors_Version Жыл бұрын

    existe alguna manera de visualizar las tablas como vos pero desde pycharm?

  • @makumbo22

    @makumbo22

    Жыл бұрын

    Alguna novedad? Yo tambient tengo la misma incomodidad

  • @eduardogabrielmoraleszaval6576
    @eduardogabrielmoraleszaval65762 ай бұрын

    30:06

  • @MrZenther
    @MrZenther Жыл бұрын

    Gracias por la info, aplicando la ley del Boomeran, como valor agregado comparto lo siuiente: (1:42:53) Para identificar de forma automatiada el tema de los espacios en blano en las cadenas de caracteres, probé esto y me fue bien: --- df_fixture_espacios = df_fixture['home'].str.contains(r"\s") df_fixture_espacios Salida: 0 True 1 True 2 True 3 True 4 True ... 59 True 60 True 61 True 62 True 63 True Name: home, Length: 64, dtype: bool

  • @DarkBack4
    @DarkBack4 Жыл бұрын

    Hola, no se si la extracion de los datos se hizo hace algun tiempo o por que el link me trae otros datos, con tablas totalmente diferentes

  • @thepycoachES

    @thepycoachES

    Жыл бұрын

    Lo más probable es que la página de Wikipedia se haya actualizado. Por ello, puse en la descripción un segundo link que muestra la página de wikipedia tal y como estaba al momento de grabar este video. Prueba el 2do link que se llama algo así como “web archive”

  • @DarkBack4

    @DarkBack4

    Жыл бұрын

    @@thepycoachES exactamente ese link estoy usando y no me regresa la misma informacion

  • @josueov8304

    @josueov8304

    Жыл бұрын

    @@thepycoachES exactamente con el link trae otros datos de las paguinas empieza en 1970 y finnliza en 2010 pero solo trae el año

  • @incognito9929
    @incognito992910 ай бұрын

    ⭐⭐⭐

  • @lismarcarolinacamachoherna3390
    @lismarcarolinacamachoherna33904 ай бұрын

    hola me sale una excepcion

  • @aldemarprinsgonzalez6958
    @aldemarprinsgonzalez69588 ай бұрын

    Excelente explicacion, pero veo que tu curso en Udemy no esta actualizado deberias actualizarlo con cosas nuevas bueno es mi opinion

  • @nestorhugoibarra2317
    @nestorhugoibarra2317 Жыл бұрын

    Hola, buen dia: La siguiente linea de codigo: df_data_historica['score'].str.split('-', expand=True) me da como resultado: 0 [41] 1 [10] 2 [30] 3 [10] 4 [63] ... 896 [01] 897 [10] 898 [20] 899 [12] 900 [00] No lo muestra como tendria que ser: [4, 1] y deduzco que es el causante del siguirente error. (codigo) df_data_historica[['HomeGoals', 'AwayGoals']] = df_data_historica['score'].str.split('-', expand=True) (error) : 399 if columns.is_unique: 400 if len(value.columns) != len(key): --> 401 raise ValueError("Columns must be same length as key") 402 else: 403 # Missing keys in columns are represented as -1 ValueError: Columns must be same length as key Me puedes ayudar en la solucon ? por favor.

  • @sistemasenoferta
    @sistemasenoferta Жыл бұрын

    pero el ganador fue argentina, en que fallo el modelo programado?

  • @kevinparedes8995

    @kevinparedes8995

    Жыл бұрын

    en que es una predicción bro, no es un programa que sea vidente del futuro

  • @ndredd1977

    @ndredd1977

    Жыл бұрын

    La teoría del caos, un evento por mínimo que sea altera todo un sistema.

  • @ConquistaATuMenteCreadora
    @ConquistaATuMenteCreadora Жыл бұрын

    50% de acierto no esta mal.

  • @claudiorom4016
    @claudiorom401611 ай бұрын

    Lo interesante fue que predijo que Francia juege la final y la pierda, no por brasil, sino por argentina🏆

  • @gerardosolares3612
    @gerardosolares361210 ай бұрын

    Disculpen mi ignorancia, pero porque dijo que ganaría Brasil?, si ganó Argentina, no se supone que debería de predecir a Argentina como ganador?

  • @darwingodoy1653

    @darwingodoy1653

    7 ай бұрын

    "Predecir" es distinto que "Acertar". Cuando creas un modelo de prediccion nunca va ser 100% efectivo ya que siempre existira un porcentaje en el que puede fallar. Por lo cual el objetivo de un modelo de prediccion no es acertar. Si no que en base a la informacion que te da el modelo tu puedas tomar mejores decisiones y arriesgarte menos en la toma de decisiones

  • @GustavoDrake
    @GustavoDrake Жыл бұрын

    Mejor era sólo escribir... print("gana Argentina")

  • @MrJulioMirko
    @MrJulioMirko10 ай бұрын

    Los medios y terrores de la Europa decadente, distopica.

  • @enriquecalle3597
    @enriquecalle3597 Жыл бұрын

    Vengo del futuro y el campeón es Argentina 🇦🇷

  • @wilbmx01

    @wilbmx01

    4 ай бұрын

    Gei

  • @loquentutos4830
    @loquentutos4830 Жыл бұрын

    Asi debio ser la final Francia vs Brazil, pero se la regalaron a Frionel Pessi

  • @ndredd1977

    @ndredd1977

    Жыл бұрын

    Jajajjajaja, la tenés adentro.

  • @GustavoDrake
    @GustavoDrake Жыл бұрын

    pero.... sale muy mal el resultado, ni braSil llega a la final, ni France gana...

  • @anibalceballoshurtado
    @anibalceballoshurtado Жыл бұрын

    Buenos dias, @ArtificialCorner quisiera hacerte una consulta. He intentado seguir este video pero me he estancado en un punto por que me aparece el siguiente error. matches = soup.find_all('div', class_='footballbox') home=[] score = [] away = [] for match in matches: home.append(match.find('th', class_= 'fhome').get_text()) score.append(match.find('th', class_= 'fscore').get_text()) away.append(match.find('th', class_= 'faway').get_text()) dict_football = {'home': home, 'score':score, 'away':away} df_football = pd.Dataframe(dict_football) df_football['year'] = '2014' print(df_football) Me arroja el siguiente error AttributeError Traceback (most recent call last) Cell In[14], line 14 10 away.append(match.find('th', class_= 'faway').get_text()) 12 dict_football = {'home': home, 'score':score, 'away':away} ---> 14 df_football = pd.Dataframe(dict_football) 15 df_football['year'] = '2014' 17 print(df_football) File ~\anaconda3\lib\site-packages\pandas\__init__.py:264, in __getattr__(name) 260 from pandas.core.arrays.sparse import SparseArray as _SparseArray 262 return _SparseArray --> 264 raise AttributeError(f"module 'pandas' has no attribute '{name}'") AttributeError: module 'pandas' has no attribute 'Dataframe' Usted me podria sugerir que podría yo hacer para corregir este error. Muchas gracias. Tengo Jupiter 6.5.4

  • @analaurajc9792
    @analaurajc9792 Жыл бұрын

    apenas puse import pandas as pd todas_tablas = pd.read_html('en.wikipedia.org/wiki/2014_FIFA_World_Cup') print(todas_tablas) Y no deja de salirme este error :c return codecs.charmap_encode(input,self.errors,encoding_table)[0] UnicodeEncodeError: 'charmap' codec can't encode character '\u2009' in position 135: character maps to Ayuda porfi, es en visual studio

  • @benja5019

    @benja5019

    Жыл бұрын

    que raro, ejecute tu codigo en mi visual studio y funciona perfect