Vladlen Koltun (nascido em 1980) é um cientista computacional israelo-americano e investigador de inteligência artificial. Presentemente, contribui como cientista distinto na Apple Inc. As suas principais áreas de investigação são inteligência artificial, visão computacional, aprendizado de máquina e reconhecimento de padrões. Também prestou contribuição significativa na área da robótica e da condução autónoma.[6]

Vladlen Koltun
Nascimento 1980
Residência Estados Unidos
Nacionalidade Israelense-Americano
Educação
Ocupação
  • Condução autónoma
  • Computação gráfica
  • Visão computacional
  • Aprendizagem automática
  • Robótica
Principais trabalhos
  • Adobe Fuse CC
  • Pesquisa sobre rede neural convolucional na área de imagens visuais
  • Simuladores de realidade virtual para condução urbana e drones
  • OpenBot[1]
  • Fotorrealismo aprimorado
Prémios
Empregador(a)
Website http://vladlen.info

As contribuições de Koltun para a pesquisa e publicações são nas áreas de redes neurais convolucionais, simulação, síntese de visualizações,[7] renderização fotorrealista, simulação para veículos autónomos urbanos, gráficos computacionais 3D, locomoção de robôs,[1] e manobrabilidade de drones em ambientes dinâmicos.[8][9]

É também conhecido pelo seu trabalho no sistema de desenvolvimento de fotorrealismo,[10][11] e pelo seu estudo crítico do índice de Hirsch, uma métrica comum na comunidade científica para avaliar o trabalho dos cientistas.[12]

Início de vida e educação

editar

Vladlen Koltun nasceu em 1980 em Kiev, Ucrânia, e cresceu em Israel.[13] Concluiu o seu mestrado em ciência da computação com distinção magna cum laude pela Universidade de Tel Aviv em 2000. Prosseguiu os seus estudos universitários e concluiu o doutoramento com honra em ciência da computação em 2002 com uma tese intitulada “Arranjos em quatro dimensões e estruturas relacionadas”; o seu orientador de doutoramento foi Micha Sharir.[13][14] De seguida, realizou o seu pós-doutoramento sob a orientação de Christos Papadimitriou na Universidade da Califórnia, Berkeley, onde realizou investigação na área da ciência da computação teórica entre 2002 a 2005.[15]

Carreira

editar

Koltun esteve colocado como professor assistente na Universidade de Stanford entre 2005 a 2013, onde deu aulas de ciência da computação, computação gráfica e algoritmos geométricos.[16] Durante o seu período em Stanford, orientou o doutoramento de estudantes e o pós-doutoramento de investigadores.[14] Ainda em Stanford, Koltun recebeu a Bolsa de Investigação Sloan[2] e o Prémio de Carreira da Fundação Nacional de Ciências.[3] A pesquisa de Koltun em Stanford contribuiu para o desenvolvimento da tecnologia de modelagem 3D baseada em dados, em colaboração com Siddhartha Chaudhur.[17] O trabalho de Chaudhuri, em conjunto com Koltun, Evangelos Kalogerakis e Leonidas Guibas, resultou numa publicação na SIGGRAPH em 2011.[18] Como resultado, a Mixamo licenciou a tecnologia de Stanford e posteriormente a Adobe Inc. adquiriu a Mixamo e desenvolveu ainda mais o Adobe Fuse CC, um software de computação gráfica 3D que permitiu aos utilizadores criar personagens 3D.[19] Em 2014, Koltun ingressou na Adobe para conduzir pesquisas na área da computação visual com foco principal na reconstrução tridimensional.[20] Koltun deixou a Adobe para ingressar na Intel, onde ocupou diversos cargos até 2021 nos projetos de P&D da empresa para Sistemas de Inteligência Artificial.[5][6] Desde agosto de 2021, Koltun colabora na qualidade de cientista ilustre na Apple Inc.[16]

Investigação

editar

Na Intel, Koltun contribuiu para o desenvolvimento de simuladores de realidade virtual para condução autónoma urbana, robôs e drones, com foco em técnicas de aprendizagem profunda por reforço com redes neurais em ambientes virtuais. Essas redes passaram por um processo de aprendizagem por tentativa e erro em realidade virtual antes de serem transferidas para robôs ou drones para aplicação no mundo real. Este método foi aplicado ao robô ANYmal, uma máquina quadrúpede com feedback proprioceptivo no controlo da locomoção.[8][21][22]

Os estudos no campo da condução autónoma urbana conduziram o grupo de Koltun ao desenvolvimento do projeto Car Learning to Act (CARLA) em 2017.[23] É um simulador de código aberto, alimentado pelo Unreal Engine, que pode ser usado para testar tecnologias de condução autónoma em ambientes realistas com situações perigosas aleatórias.[23][24][25] O projeto foi financiado pela Intel Labs e pelo Toyota Research Institute.[23][26]

Em 2020, inspirado pelo Google Cardboard, Koltun desenvolveu o OpenBot em conjunto com o cientista alemão Matthias Müller.[1][27] Trata-se de um conjunto de soluções de software que transforma smartphones Android em robôs de quatro rodas capazes de navegar, localizar objetos e evitar obstáculos. O robô inclui um chassi impresso em 3D que comporta um controlador, LEDs, um suporte para smartphone e um cabo USB.[27] O software consiste na placa Arduino Nano, que faz a ponte entre o smartphone e as tarefas de atuação do motor e das baterias, e uma aplicação para Android, responsável pela integração dos dados.[1][27] O projeto foi lançado como software de código aberto para aplicações relacionadas com a robótica,com o kit de desenvolvimento de software disponível no GitHub.[28][29]

Koltun também contribuiu para o desenvolvimento adicional nas áreas de síntese de visualizações fotorealísticas em 3D. Em 2021, utilizando o seu trabalho com outros investigadores na Intel, chamado “Aperfeiçoar o Melhoramento do Fotorrealismo”,[30] foi testado no jogo Grand Theft Auto 5.[31][32][33]

Crítica ao índice de Hirsch

editar

Koltun expressou preocupação quanto à fiabilidade do índice h, destacando o aumento dos seus valores devido à prevalência de múltiplas coautorias nas comunidades científicas. Esta crítica foi apresentada em colaboração com David Hafner.[34][35]

Trabalhos selecionados

editar
  • Richter, Stephan R.; Hassan Abu AlHaija; Koltun, Vladlen (2021). "Aperfeiçoar o Melhoramento do Fotorrealismo" . arXiv : 2105.04619 [cs.CV].
  • Joonho Lee, Jemin Hwangbo, Lorenz Wellhausen, Vladlen Koltun, Marco Hutter; Aprendendo Locomoção Quadrúpede em Terreno Desafiante, Science Robotics (2020)
  • Elia Kaufmann, Antonio Loquercio, René Ranftl, Matthias Müller, Vladlen Koltun, Davide Scaramuzza; Acrobacias Profundas de Drones, Robotics: Science and Systems (2020)
  • Manolis Savva, Abhishek Kadian, Oleksandr Maksymets, Yili Zhao, Erik Wijmans, Bhavana Jain, Julian Straub, Jia Liu, Vladlen Koltun, Jitendra Malik, Devi Parikh, Dhruv Batra; Habitat: Uma Plataforma para Pesquisa em IA Encarnada," Conferência Internacional de Visão Computacional (2019)
  • Chen Chen, Qifeng Chen, Jia Xu, Vladlen Koltun, Aprendendo a Ver no Escuro, Conferência de Visão Computacional e Reconhecimento de Padrões (CVPR), Salt Lake City, UT, junho de 2018
  • Bai, Shaojie; Zico Kolter, J.; Koltun, Vladlen (2018). " Uma Avaliação Empírica de Redes Genéricas Convolucionais e Recorrentes para Modelagem de Sequências". arXiv : 1803.01271 [ cs.LG ].
  • Zhou, Qian-Yi; Park, Jaesik; Koltun, Vladlen (2018). "Open3D: Uma Biblioteca Moderna para Processamento de Dados 3D". arXiv : 1801.09847 [ cs.CV ].
  • Alexey Dosovitskiy, German Ros, Felipe Codevilla, Antonio López, Vladlen Koltun; CARLA: Um Simulador Aberto de Condução Urbana, Conferência sobre Aprendizagem de Robôs (CoRL) 2017
  • F Yu, V Koltun; Agregação de Contexto em Múltiplas Escalas por Convoluções Dilatadas, Conferência Internacional sobre Representações de Aprendizado (ICLR) 2016.
  • Stephan R Richter, Vibhav Vineet, Stefan Roth, Vladlen Koltun; Jogando por Dados: Verdade Fundamental de Jogos de Computador, Conferência Europeia de Visão Computacional (ECCV) 2016
  • Sergey Levine, Vladlen Koltun; Busca de Política Orientada, Conferência Internacional de Aprendizado de Máquina (ICML) 2013
  • Philipp Krähenbühl, Vladlen Koltun; Inferência Eficiente em CRFs totalmente ligados por potenciais Gaussianos de ponta, Avanços em Sistemas de Informação Neural de Processamento (NIPS) 2011

Referências

  1. a b c d «How To Turn Your Smartphone Into A Robot». Discover Magazine. Consultado em 2 de março de 2024 
  2. a b «Sloan Research Fellowship in computer science (2007)» (PDF). Alfred P. Sloan Foundation. Consultado em 7 de março de 2024 
  3. a b «Career Award:Fundamental Geometric Algorithms». National Science Foundation. Consultado em 7 de março de 2024 
  4. «Computer Graphics as a Telecommunication Medium». Princeton University 
  5. a b «Computer Science Bibliography: Vladlen Koltun's affiliations». Schloss Dagstuhl, Leibniz Center for Informatics. Consultado em 8 de março de 2024 
  6. a b «Vladlen Koltun». Institute of Electrical and Electronics Engineers 
  7. «This new tech from Intel Labs could revolutionize VR gaming». PC Games 
  8. a b Lee, Joonho; Hwangbo, Jemin; Wellhausen, Lorenz; Koltun, Vladlen; Hutter, Marco. «Learning quadrupedal locomotion over challenging terrain». Science Robotics. 5 (47). doi:10.1126/scirobotics.abc5986 
  9. «Robots, hominins and superconductors: 10 remarkable papers from 2019». Nature. 576 (7787): 394–396. 2019. doi:10.1038/d41586-019-03834-4 
  10. «GTA 5 fica mais realista com aprendizado de máquina do Intel Labs». Terra 
  11. «GTA 5: Intel überarbeitet Spielegrafik mithilfe deutscher Städte». Allround-PC 
  12. Jamie Durrani (29 de julho de 2021). «Reliability of researcher metric the h-index is in decline». Chemistry World 
  13. a b «Arrangements in four dimensions and related structures». The National Library of Israel 
  14. a b «Vladlen Koltun». Math Genealogy 
  15. «Introducing scholars who have recently joined the faculty». Stanford University News 
  16. a b «Vladlen Koltun's Biography». Consultado em 8 de março de 2024 
  17. «3D modeling with data-driven suggestions». Stanford Digital Repository. Consultado em 7 de março de 2024 
  18. «Probabilistic Reasoning for Assembly-Based 3D Modeling». Cornell University. Consultado em 8 de março de 2024 
  19. «Adobe buys 3D startup Mixamo». Fortune. Consultado em 8 de março de 2024 
  20. «Learning Complex Neural Network Policies with Trajectory Optimization». Stanford Graphics. Consultado em 8 de março de 2024 
  21. «How robots learn to hike». ScienceDaily. Consultado em 2 de março de 2024 
  22. Lee, Joonho; Hwangbo, Jemin; Wellhausen, Lorenz; Koltun, Vladlen; Hutter, Marco. «Learning Quadrupedal Locomotion over Challenging Terrain». Science Robotics. 5 (47). doi:10.1126/scirobotics.abc5986 
  23. a b c «Toyota donates $100,000 for open-source self-driving simulator». CNET. Consultado em 2 de março de 2024 
  24. «The Open-Source Driving Simulator That Trains Autonomous Vehicles». MIT Technology Review. Consultado em 2 de março de 2024 
  25. Dosovitskiy, Alexey; Ros, German; Codevilla, Felipe; Lopez, Antonio; Koltun, Vladlen. «CARLA: An Open Urban Driving Simulator». Conference on Robot Learning (CoRL) 
  26. «Carla Project». Consultado em 2 de março de 2024 
  27. a b c «Intel researchers design smartphone-powered robot that costs $50 to assemble». VentureBeat 
  28. Müller, Matthias; Koltun, Vladlen. «OpenBot: Turning Smartphones into Robots». Cornell University 
  29. «OpenBot code». GitHub 
  30. «Machine Learning Takes GTA V Photorealism to Never-Before-Seen Levels». Interesting Engineering 
  31. «'Grand Theft Auto V' mod adds uncanny photorealism through AI». Engadget 
  32. Andrew Liszewski (12 de maio de 2021). «Grand Theft Auto Looks Frighteningly Photorealistic With This Machine Learning Technique». Gizmodo. Consultado em 2 de março de 2024 
  33. Ben Dickson (31 de maio de 2021). «Intel's image-enhancing AI is a step forward for photorealistic game engines». VentureBeat. Consultado em 2 de março de 2024 
  34. Koltun, Vladlen; Hafner, David. «The h-index is no longer an effective correlate of scientific reputation». PLOS ONE. 16 (6): e0253397. doi:10.1371/journal.pone.0253397 
  35. Hafner, David. «Data for "The h-index is no longer an effective correlate of scientific reputation"». Mendeley Data. 1. doi:10.17632/wsrjd8m2h6.1 

Ligações externas

editar