Original Article: CAREER: Building Resilient Internet Services with Learning and Control
Author: cs.uccs.edu

CARREIRA: Criando Serviços de Internet Resilientes com Aprendizagem e Controle (NSF CNS-0844983, 09/2009-08/2014)

Descrição e objetivos do projeto

Devido à natureza dinâmica e à escala sem precedentes da Internet, os serviços de Internet representam desafios, incluindo escalabilidade, confiabilidade e disponibilidade para sistemas em rede subjacentes. Este projeto CAREER, dirigido por Prof. Xiaobo Zhou, concentra-se na construção de serviços de Internet que são resilientes a esses desafios com técnicas de aprendizado e controle de máquinas. Os serviços de Internet baseiam-se em sistemas informáticos baseados em cluster que continuam crescendo em escala e complexidade. Tais sistemas tornam-se tão complicados que é mesmo um grande desafio obter uma boa compreensão de todos os comportamentos dinâmicos do sistema. Os investigadores adotaram uma abordagem analítica e organizada para projetar uma infraestrutura de software autônomo em sistemas em rede para a construção de serviços de Internet resilientes. O projeto desenvolve modelos empíricos usando aprendizado estatístico para ajudar a superar os desafios de escala e complexidade em sistemas em rede. Ele projeta algoritmos coordenados de controle de admissão e planejamento de capacidade com qualidade de serviço de ponta a ponta em clusters de várias camadas. As técnicas de controle independentes do modelo são usadas com modelos empíricos para alocar recursos e reconfigurar dinamicamente o sistema para necessidades de otimização de desempenho. Desenvolve recursos de diferenciação de desempenho, isolamento e reconfiguração auto-adaptativa para melhorar a confiabilidade e a disponibilidade do sistema. Ele amplia o impacto da pesquisa ao desenvolver um banco de provas em um laboratório de centro de dados para demonstrar a orquestração de técnicas projetadas para arranjo automatizado, coordenação e gerenciamento de sistemas informáticos complexos, middleware e serviços.

O projeto de pesquisa é executado em um laboratório de ponta localizado no novo edifício de ciência e engenharia. A sala de servidores está equipada com uma instalação de ponta de centro de dados HP de ponta que possui três racks de módulos de servidor blade HP ProLiant BL460C G6 e uma rede de área de armazenamento HP EVA de 40 TB com canais duplos e iSCSI de fibra de 10 Gbps e 8 Gbps. Possui três equipamentos APR InRow RP refrigerados a ar e UPS para um máximo de 40 kW no design de redundância n + 1.

Este projeto de cinco anos foi iniciado em setembro de 2009.

Participantes

Publicações patrocinadas pelo projeto (Download Bibtex)

  • "Rumo à Eficiência Energética em Clusters de Hadoop Heterogêneos por Tarefa de Tarefas Adaptativas ", Dazhao Cheng, Palden Lama, Changjun Jiang e Xiaobo Zhou, Proc. Do 35º ICDCS do IEEE (taxa de aceitação 12,8%), 10 páginas, junho / julho de 2015.
  • "Colocação e migração de carga de trabalho com reconhecimento de heterogeneidade em Datacenters Datados Distribuídos ", Dazhao Cheng, Changjun Jiang e Xiaobo Zhou, Proc. Do 28º IPDPS IEEE (taxa de aceitação 21%), 10 páginas, maio de 2014.
  • "Otimizando o Programação de Máquina Virtual em NUMA Multicore Systems ", Jia Rao e Xiaobo Zhou, em Proc. Do 19º PPM PPPP (taxa de aceitação 16%), 10 páginas, fevereiro de 2014.
  • "Diferenciação de serviços de várias camadas por meio de controle coordenado de aprovisionamento de recursos e controle de admissão ", aceito pelo Journal of Paralleland Distributed Computing, janeiro de 2014.
  • "Garantia coordenada e Garantia de Desempenho com Fuzzy MIMO Control em Clusters de Servidores Virtualizados ", Palden Lama e Xiaobo Zhou, IEEE Transactions on Computers, 14 páginas, aceito, julho de 2013.
  • "Aprovisionamento Autônomo com Controle Fuzzy Neural Auto-Adaptativo para garantia de atraso com percentil ", Palden Lama e Xiaobo Zhou, Transações ACM em Sistemas Autônomos e Adaptativos, 8 (2): 1-31, julho de 2013.
  • "iShuffle: Melhorando o desempenho do Hadoop com o Shuffle-on-Write ", Yanfei Guo, Jia Rao e Xiaobo Zhou, ganhou o Prêmio Melhor Papel do 10º USENIX ICAC, 11 páginas, San Jose, junho de 2013.
  • "V-Cache: Rumo ao provisionamento flexível de recursos para aplicativos de várias camadas em nuvens IaaS ", Yanfei Guo, Palden Lama, Jia Rao e Xiaobo Zhou, no Proc. Do 27º IPDPS IEEE, 12 páginas, Boston, maio de 2013 (taxa de aceitação 21%).
  • "Auto-ajuste de lotes com DVFS para Melhorar o Desempenho e a Eficiência Energética em Servidores ", Dazhao Cheng, Yanfei Guo e Xiaobo Zhou, em Proc. Da 21ª MADEIRA IEEE (taxa de aceitação 27%), 10 páginas, São Francisco, agosto de 2013.
  • "Power-Aware Dynamic Placement and Migration in Virtualized GPU Environments ", Palden Lama, Yan Li, Ashwin Aji, Pavan Balaji, James Dinan, Shucai Xiao, Yunquan Zhang, Wwchun Feng, Rajeev Thakur, Xiaobo Zhou, Proc. Do 33º IEEE ICDCS, 10 páginas, Philadephia, julho de 2013 (taxa de aceitação 13%).
  • "Desempenho Autônomo e Controle de Potência para Aplicações Web Co-Localizadas em Servidores Virtualizados ", Palden Lama, Yanfei Guo e Xiaobo Zhou, em Proc. Da 21ª IWQoS ACM / IEEE (taxa de aceitação 28%), 10 páginas, Montreal, junho de 2013.
  • "Otimizando o agendamento da máquina virtual em NUMA Multicore Systems ", Jia Rao, Kun Wang, Xiaobo Zhou e Cheng-Zhong Xu,   Proc. do 19º IEEE HPCA (taxa de aceitação 20%), 12 páginas, fevereiro de 2013. O documento é um dos quatro candidatos do Best Paper Award (de 249 submissões).
  • Parâmetro de Servidor Automatizado e Agilizado por Aprendizagem e Controle Coordenados ", Yanfei Guo, Palden Lama, Changjun Jiang e Xiaobo Zhou, Transações IEEE em Sistemas Paralelos e Distribuídos, aceita, abril de 2013.
  • "A-GHSOM: Um mapa auto-organizador hierárquico de crescimento adaptativo para detecção de anomalia de rede ", Dennis Ippoliti e Xiaobo Zhou, Journal of Parallel and Distributed Computing, Elsevier, Vol. 72, nº 12, páginas 1576-1590, dezembro de 2012.
  • "NINPIN: Isolamento de Desempenho Não-Invasivo e de Eficiência Energética em Servidores Virtualizados ", Palden Lama e Xiaobo Zhou, 12 páginas, In Proc. Of 42º IEEE / IFIP DSN, junho de 2012 (taxa de aceitação 17%).
  • "AROMA: Alocação Automática de Recursos e Configuração do Ambiente MapReduce na Nuvem ", Palden Lama e Xiaobo Zhou, 10 páginas, In Proc. Of o 9º ACM ICAC, setembro de 2012 (taxa de aceitação 22%).
  • "Parâmetro de Parâmetro de Servidor Automatizado e Agilizado com Aprendizagem e Controle ", Yanfei Guo, Palden Lama e Xiaobo Zhou, 12 páginas,         Em Proc. do 26º IEEE IPDPS, maio de 2012 (taxa de aceitação 21%).
  • "Coordenação de redimensionamento de VM e ajuste de servidor: throughput, Eficiência de potência e escalabilidade ", Yanfei Guo e Xiaobo Zhou, em Proc. Dos 20 pares de IEEE (taxa de aceitação 36%).
  • "Diferenciação de serviços de vários níveis: Provisão coordenada de recursos e controle de admissão ", Sireesha Muppala, Xiaobo Zhou e Guihai Chen, Proc. dos 18 IEEE ICPADS (taxa de aceitação 30%), dezembro de 2012.
  • "Uma abordagem de auto-otimização de auto-ajuste para sistemas automatizados de detecção de anomalia de rede ", Dennis Ippoliti e Xiaobo Zhou, In Proc. Of the o 9º ACM ICAC, setembro de 2012.
  • "Efficient Server Provisioning with Control for End-to-End Response Time Guarantee em Cluster Multi-tier ", Palden Lama e Xiaobo Zhou,         Transações IEEE em Sistemas Paralelos e Distribuídos, Vol. 23, nº 1, 2012; Download Link; Slides de conversa (IWQoS'09).
  • "Regression Based Resource Provisioning para Sessão Slowdown Garantias em Multi-tier Internet Servers ", Sireesha Muppala, Xiaobo Zhou, Liqiang Zhang e Guihai Chen,          Journal of Parallel and Distributed Computing, Elsevier, aceito em novembro de 2011; Download Link.
  • Diferenciação de serviços de vários níveis: Provisão de recursos e controle de admissão coordenados, Sireesha Muppala, Xiaobo Zhou e Guihai Chen, Proc. da 18ª Conferência Internacional IEEE sobre Sistemas Paralelos e Distributados (ICPADS), Cingapura, dezembro de 2012 (taxa de aceitação de 30%)
  • "PERFUME: Garantia de poder e desempenho com o Controle MIMO Fuzzy em Servidores Virtualizados ", Palden Lama e Xiaobo Zhou, Proc. do 19º Workshop Internacional ACM / IEEE sobre Qualidade de Serviço (IWQoS), páginas 1-9, junho de 2011 (taxa de aceitação de 28%); Download Link; Slides de conversa.
  • "aMOSS: Aprovisionamento automatizado do servidor multi-objetivo com curvatura de tensão-deformação ", Palden e Xiaobo Zhou, Proc. do 40º IEEE             Conferência Internacional sobre Processamento Paralelo (ICPP), páginas 145-154, setembro de 2011 (taxa de aceitação 21%). Download Link; Slides de conversa.
  • "Enhanced Statistics-based Rate Aadapation para 802.11 em redes sem fio ", Liqiang Zhang, Yujen Cheng e Xiaobo Zhou,          Journal of Network and Computer Applications, Elsevier 34 (5), setembro de 2011; Download Link.
  • "Controle de admissão baseado em sessão coordenada com aprendizado estatístico para aplicativos de Internet de vários níveis ", Sireesha Muppala e Xiaobo Zhou, Journal of Network and Computer Applications, Elsevier, Vol. 34, No. 1, pp. 20-29, janeiro de 2011; Download Link.
  • "Aprovisionamento Autônomo com Controle Fuzzy Neural Auto-Adaptativo para Garantia de Retardo de Extremidade a Extremidade ", Palden Lama e Xiaobo Zhou,         Procedimentos do 18º Simpósio Internacional IEEE / ACM sobre Modelagem, Análise e Simulação de Sistemas de Computadores e Telecomunicações (MASCOTS 2010), páginas 151-160,         Miami, agosto de 2010 (aceito como um papel extenso e prolongado com a taxa de seleção de 16%); Download Link; Slides de conversa.
  • "Regressão com base em vários níveis de provisionamento de recursos para garantia de atraso de sessão ", Sireesha Muppala, Xiaobo Zhou e Liqiang Zhang,          Proc. da 29ª Conferência Internacional de Computação e Comunicação do Desempenho da IEEE (IPCCC), Albuquerque, dezembro de 2010 (taxa de aceitação de 28%); Download Link; Slides de conversa.
  • "Um mapa auto-organizacional hierárquico de crescimento adaptativo para detecção de intrusão de rede ", Dennis Ippoliti e Xiaobo Zhou,         Procedimentos da 19ª Conferência Internacional IEEE sobre Comunicação e Redes de Computadores (ICCCN 2010), Zurique, Swizerland, agosto de 2010 (taxa de aceitação de 30%); Download Link; Slides de conversa.

Reconhecimento

Este material é baseado no trabalho apoiado pela National Science Foundation sob o Grant CNS-0844983.      Quaisquer opiniões, conclusões e conclusões ou recomendações expressadas neste material são as do (s) autor (es) e não refletem necessariamente as opiniões da National Science Foundation (NSF).