Eu não costumo dar muitos pitacos sobre a discussão R ou Python. Na verdade, tem vezes que falo, mas é sempre falando que não importa. Recentemente, solicitaram minha resposta no Quora e resolvi atender ao pedido. Segue minha resposta.
Esse debate é infinito. SAS tem algumas vantagens, pois a curva de aprendizado é muito rápida. É simples de aprender, há muitas possibilidades no seu “point and click”, porém eu vejo pouca flexibilidade em comparação com as demais.
Python é excelente, possui algumas coisas parecidas com C e outras linguagens (o que torna sua curva de aprendizado mais rápida que a de R), é open source (assim como R), muito flexível, é a linguagem do hype (você vai ver na maioria das áreas de data science), útil para além de data science, facil para ‘deployar’, fácil de ler.
R é muito utilizado na academia e por pesquisadores, acredito que tenha vantagens na questão de análise exploratória e análises estatísticas, excelentes bibliotecas (acredito que tenha mais que Python, mas é necessário validar essa informação).
Qual a melhor? Você perderá pouco ao escolher uma ao invés da outra. Minha recomendação é usar o que sua área usa. É acadêmico? Vai de R. É do mercado? Vai de Python.
Se ainda assim quiser uma análise mais profunda, recomendo ver os artigos do KdNuggets e do Datacamp. Ambos falam bastante dessa escolha.