Resolvendo UnicodeDecodeError no Python

Mais uma vez vamos lidar com um erro comum no Python, mais especificamente do Pandas, quando importamos um arquivo. Se você precisa lidar com arquivos em português, em algum momento já se deparou com esse erro:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0x8d in position 8: invalid start byte

O problema aqui é a acentuação. Se você tem cedilha ou acentos, esse erro vai acontecer. Você pode solucionar de duas formas: (1) pedindo para as pessoas pararem de usar acentos nos arquivos (sonho); (2) utilizando o parâmetro encoding=’unicode_escape’ na hora de importar o arquivo:

import pandas as pd
df = pd.read_csv('nome_do_arquivo.csv', encoding= 'unicode_escape')

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *