Original Article: Research Statement
Author: Yan-Bin Jia

Declaração de pesquisa

(para mandato)

Yan-Bin Jia

Minha investigação sobre a destreza robótica tem como objetivo buscar uma compreensão coordenada de problemas computacionais e de controle nas tarefas de manipulação. Um dos objetivos deste estudo é a recuperação dinâmica de informações geométricas, como forma e pose, e de informações mecânicas como movimento e força. Outro objetivo é a engenharia cuidadosa das informações acima para tornar o robô exibir habilidades durante a execução de tarefas físicas. Através de esforços equilibrados entre pesquisa teórica e demonstração experimental, espero obter conhecimentos aprofundados sobre ação e inteligência à medida que interagem uns com os outros. Do ponto de vista da aplicação, esse conhecimento terá a promessa de impactar não só na automação industrial, mas também em robôs pessoais no futuro.

Para o robô, eventualmente, demonstrar habilidades que se aproximam do nível humano, deve-se conseguir uma estreita integração de detecção em ação para abrir caminho para uma estrutura em que as habilidades de manipulação objetiva de objetos podem ser formuladas, analisadas e automatizadas. Para demonstrar a filosofia acima, fiz uso primário de uma fonte de informação que é omnipresente no mundo físico --- contato entre dois ou mais corpos. Isso pode ser a localização ou a força do contato ou ambos. Estou particularmente interessado no contato entre uma mão robótica (o termo "mão robótica" refere-se a um manipulador em geral, mesmo moldado de forma semelhante à mão humana) e um objeto sendo manipulado pela mão.

Sob o apoio de um NSF CAREER Award (2002-2007), minha investigação centrou-se até agora na localização, no reconhecimento, na reconstrução, bem como na compreensão de formas (em particular, formas curvas) que eu acho fundamentais para alcançar habilidades e manipulação inteligente de objetos.

No futuro próximo (até 2007), meu foco principal será aprofundar a investigação acima, com uma mudança de atenção para as formas curvas em 3D. Mais detalhes abaixo desta linha de pesquisa são descritos no final das Partes 1 e 2 abaixo.

No futuro próximo, minha pesquisa se ramificará para hápticas, manipulação destreza e interação humano-robô. Um plano para esses esforços seguirá na Parte 5.

  1. Reconhecimento de forma tátil através de invariantes diferenciais..

    Ph.D. o estudante Rinat Ibrayev e eu estudamos como reconhecer formas delimitadas por curvas polinomiais de baixo grau usando dados táteis mínimos. O problema generaliza o reconhecimento tradicional baseado em modelo, no sentido de que cada modelo agora não é apenas uma forma específica, mas sim uma família de um contínuo de formas paramétricas.

    Os invariantes diferenciais e semi-diferenciais têm a vantagem de exigir dados locais (que são produzidos apenas por sensores de toque). Os invariantes que derivamos são independentes não apenas de tradução e rotação (como invariantes usados na visão computacional), mas também pontos de fronteira em que são avaliados. Em teoria, são necessários no máximo três desses pontos para curvas quadráticas e curvas de spline cúbicas.

    Esses invariantes nos permitem discriminar uma família de curvas de outra e determinar o formato real da família reconhecida. Além disso, os locais de contato em que os dados táteis foram obtidos também podem ser estimados, portanto, a colocação relativa do dedo na forma é conhecida. Portanto, a abordagem baseada em invariantes tem o potencial de unificar reconhecimento, recuperação e localização de forma bem como a mão humana faz subconscientemente todos os dias.

    Realizamos experiências preliminares com dados táteis reais para apoiar a validade desta abordagem. Um método estável é concebido para estimar a curvatura e sua derivada.

    O trabalho preliminar sobre este tema foi relatado na Conferência Internacional IEEE de 2004 sobre Robótica e Automação (ICRA). Uma versão mais completa (com alguns resultados experimentais) foi apresentada no Workshop Internacional 2004 sobre Fundamentos Algorímos da Robótica (WAFR), e foi selecionada para uma edição especial do International Journal of Robotics Research (IJRR) em 2005.

    Extensões futuras: WVamos ampliar o design de invariantes para curvas mais gerais usadas em aplicativos e construir uma árvore de reconhecimento para formas curvas 2D que podem ser pesquisadas com uma consulta gerada em dados táteis. Em seguida, passaremos a investigar o reconhecimento invariante de formas curvas em 3D (que é um potencial tópico de tese de doutorado para Rinat).

  2. Localização e reconstrução de peças com sensores tácteis

    Inspirado pela habilidade da mão humana para determinar sua colocação em um objeto familiar através do rastreamento de dedos e tentativas, mostrei como localizar uma forma curvada 2D pelo rolamento de um maxilar equipado com um sensor de toque. A informação mensurável inclui o quanto a mandíbula girou e até onde se moveu na forma.

    Eu projetei um algoritmo numérico que calcula a configuração do maxilar após o movimento de rolamento. O algoritmo está completo e a quantidade de computação numérica é otimamente assintoticamente. A localização foi demonstrada através de experimentos em um robô. Ao invés de usar sensores de força / torque industrial (que são onerosos e às vezes exagerados para experiências de laboratório), implementei um sensor de força / torque de 3 eixos que pode detectar a localização do contato. Resultados progressivos no trabalho de localização foram apresentados no ICRA 2000 e nas Conferências Internacionais IEEE / RSJ de 2001 e 2003 sobre Robôs e Sistemas Inteligentes (IROS). Um resumo foi aceito condicionalmente para as Transações de IEEE em Robótica.

    Enquanto isso, Ph.D. o aluno Liangchuan Mi mostrou como um simples sensor de toque como um joystick pode ser usado para reconstruir formas curvas planas com quase nenhuma perda de precisão da forma. Apesar do sensor de força limitado do joystick, ele pode gerar medições de contato precisas aproveitando a alta precisão de posicionamento do robô Adept. Liangchuan surgiu com uma estratégia de controle de posição muito eficaz que prevê a direção do movimento no próximo passo com base na leitura da força atual e em um ajuste polinomial para o histórico de rastreamento local. Este trabalho será apresentado no IROS 2004 no Japão.

    Extensões futuras: A localização de um objeto em relação à mão por toque mudará o paradigma de agarrar na robótica, onde atualmente a detecção é frequentemente realizada com antecedência por um sistema de visão ou por sensores separados da mão. Uma investigação mais aprofundada sobre a interpretação do "sentimento" pelo toque, acredito, possibilitará uma estreita integração entre detecção e controle. O próximo passo será avançar para estudar estratégias de compreensão que sejam orientadas por feedback e mais robustas para erros e incertezas. Enquanto isso, o trabalho de rastreamento de formas será estendido para a reconstrução de superfícies 3D, o que espero que Liangchuan investigue comigo em seu Ph.D. trabalho de tese.

  3. Cálculo da curva e busca de agrafos antipodais.

    Encontrar subestruturas geométricas relacionadas a curvas (como tangentes comuns e pontos antipodais) pode ser formulada como programação tradicional não-linear. Mas tal solução não seria completa nem eficiente devido à natureza local inerente aos métodos de programação não-linear. Eu demonstrei que, em duas dimensões, a eficiência computacional e (quase) completude podem ser alcançadas através da exploração da geometria global e diferencial.

    Eu introduzo um esquema de processamento de curva que disseca uma curva em segmentos monótonos (com base em alguns critérios específicos da tarefa) e, em seguida, os casais que marcham com a bisecção numérica desses segmentos para procurar as subestruturas desejadas. Para demonstrar essa ideia, apresento um algoritmo eficiente que calcula, até a resolução numérica, todos os pares de pontos antipodais em uma forma curva planar. Esses pontos são usados para alcançar os segmentos estáveis da forma. O algoritmo faz uso de novas perspectivas sobre a geometria diferencial em dois pontos antipodais e emprega uma sub-rotina para construir todas as tangentes comuns de dois segmentos de curva. A taxa de convergência numérica e o tempo de execução do algoritmo foram determinados.

    O trabalho representa um avanço na computação que envolve curvas paramétricas, e também oferece uma solução muito satisfatória para um dos problemas bem conhecidos no domínio do robô. É descrito em um documento de 31 páginas da IJRR em 2004.

    Além disso, apliquei o esquema de cálculo de curva acima para construir cascos convexos para curvas de plano paramétrico fechado. Este trabalho está resumido em uma submissão de 51 páginas à Computational Geometry: Theory and Applications.

  4. Detecção de robô geométrico e dinâmico (tese de doutorado)

    Meu trabalho de tese investigou estratégias de detecção geométrica e mecânica para objetos de formas conhecidas (que incluem peças industriais e itens de desktop todos os dias). Introduzi duas estratégias que usam restrições geométricas simples para imobilizar o objeto ou para distinguir sua pose real de um número finito de poses aparentes. Problemas de complexidade computacional são examinados. Então, desenvolvi uma estratégia de detecção chamada "pose e movimento de contato". Ao aplicar a teoria da observabilidade não linear, demonstrei que a informação essencial da tarefa é frequentemente escondida nas interações mecânicas e mostrou como essas informações podem ser devidamente reveladas. Observadores não-lineares foram concebidos para o efeito.

    O trabalho de tese foi realizado na Universidade Carnegie Mellon. A maioria dos resultados foi publicada em dois artigos IJRR (28 páginas e 25 páginas, respectivamente) em 1996 e 1999. Um resultado independente (na observabilidade local de um objeto 3D rolando em uma palma imbuída de sensores táteis) foi apresentado na WAFR em 1998.

  5. Plano de pesquisa futuro

    Além dos esforços contínuos no reconhecimento e reconstrução da forma tátil, conforme descrito nas Partes 1 e 2, minha futura agenda de pesquisa também incluirá hápticas, manipulação destreza e interação humano-robô.

    Um dos problemas abertos em haptics é lidar com atrasos de resposta que muitas vezes causam a instabilidade de um sistema háptico. Isto é principalmente devido à falta de um modelo confiável do ambiente físico. Enquanto isso, muito precisa ser investigado na renderização hábil no uso de medidas em ambientes reais para construir modelos de formas físicas, rigidez, textura, etc. Para acelerar a resposta, as medidas táteis podem ser combinadas com um conhecimento a priori para construir uma base áspera modelo do ambiente (local). Esse modelo fornece informações como forma, rigidez, etc. Será então refinado durante as interações entre o servo e o meio ambiente sob orientação do usuário. Com múltiplos usuários que interagem com o mesmo ambiente, a fusão de dados táteis e o planejamento do caminho também estão entre tópicos de pesquisa interessantes.

    Na manipulação destreza, eu gostaria de abordar o problema de manipular um objeto enquanto explorava suas propriedades geométricas e físicas, com ou sem visão. As aplicações incluem tarefas com altos graus de complexidade, como cirurgias robóticas e robóticas, exploração espacial e robótica doméstica (tarefas de substituição de uma lâmpada para limpar os pratos na mesa). O problema é um domínio representativo onde várias áreas de pesquisa em robótica se unem: dinâmica e controle da mão; observabilidade do objeto; agarrando sob restrições dinâmicas; planejamento da trajetória de manipulação; recuperação / estimativa de forma, texturas, rigidez, etc .; e fusão de sensor (por exemplo, na presença de múltiplos sensores de toque ou um sistema de visão). O trabalho existente concentrou-se principalmente em uma das áreas acima, às vezes sob pressupostos restritos, de modo que os resultados não são gerais o suficiente para ser aplicável em tarefas reais com graus razoáveis ​​de complexidade. Claramente, são necessários esforços para entender seus papéis e interações e caracterizar os resultados em um quadro unificado para que haja um grande avanço no campo. Essa compreensão e sua verificação experimental serão necessárias antes do advento dos robôs de propósito geral. Estou ciente de que esta pesquisa pode revelar-se um esforço científico a longo prazo, mas os esforços dedicados definitivamente valerão a pena.

    Outra área interessante que espero explorar no futuro é a interação humano-robô. Como fazer o robô aprender habilidades de manipulação quando treinado por um ser humano? Um robô e um humano podem participar fisicamente de um jogo como o poker do jeito que dois humanos fazem (cartas, cartas de mistura, etc.)? Espera-se que o aprendizado desempenhe um papel importante, exceto as habilidades a serem aprimoradas sob a forma de algoritmos de controle que se ocupam principalmente da mecânica. Com base nas interações, o treinador humano sempre deve ser capaz de acelerar o processo de "aprendizagem" reprogramando conhecimento refinado no robô.

    Eu imagino que meu laboratório se torne um grupo de pesquisa com pelo menos cinco estudantes de pós-graduação e alguns assistentes de pesquisa de graduação, nos próximos anos. Três ou quatro anos depois, o grupo deverá produzir pelo menos um Ph.D. todos os outros anos. Vou trabalhar duro para manter o fluxo de estudantes de pós-graduação e a produção intelectual do laboratório. Suporte de subsídio suficiente e uma estratégia agressiva de recrutamento de estudantes são ambos vitais para atingir os objetivos acima. Com esses esforços, vou me esforçar para construir o laboratório em um lugar robótico visível fortemente orientado para geometria, toque e destreza robótica.