quinta-feira, 25 de julho de 2013

Navios Adapteva kickstarted placas supercomputador do bebê


Nuvem de armazenamento: Menor custo e aumentar o tempo de atividade


Processador RISC Upstart e coprocessador designer de Adapteva é o transporte a primeira de suas placas de sistema Parallella, que sua Epifania processadores multicore com processadores ARM para criar uma corajosa e razoavelmente enérgico motor de computação híbrida que não custa muito e é muito eficiente de energia para certos tipos de processamento.


Não é barato para projetar e fab coprocessors ou fazer placas de sistema que fazem uso deles, assim co-fundador do Adapteva e CEO Andreas Olofsson despediu-se de um projeto de arrecadação de fundos Kickstarter local no ano passado para levantar o dinheiro para fab os chips, em vez de seguir o caminho tradicional de captação de recursos de risco e tentar obter vitórias projeto.


Enquanto Adapteva não cumpriu a sua pie-in-the-sky sonho de levantar US $ 3 milhões para financiar integralmente um conjunto de multi-núcleo RISC coprocessors epifania e placas de sistema Parallella que fazem uso deles, a empresa tem 4.965 apoiadores que prometeram $ 898921 e encomendaram mais de 6.300 placas com vários processadores Epiphany compensada com dual-core ARM Cortex A9 processadores ZYNC da Xilinx, que vende os chips ARM amassada com suas matrizes de portas de campo programáveis ​​(FPGA).


O núcleo Epifania encarna a essência do Reduced Instruction Set Computing, com apenas 35 instruções, e tem um núcleo dual-edição com 64 registros. Tem uma unidade aritmética e lógica (ALU) e uma unidade de ponto flutuante, e uma memória RAM estática 32KB no outro lado daqueles registos. Cada núcleo tem também um roteador que tem quatro portas que podem ser estendidas para fora em uma matriz de 64x64 dos núcleos para um total de 4.096 núcleos.


Diagrama de blocos do chip Epifania

Diagrama de blocos do chip RISC Epifania



O chip Epiphany-III é implementado em um processo de 65 nanômetros e 16 núcleos de esportes e da Epifania-IV é implementado em um processo de 28nm e dispõe de 64 núcleos. Este último chip de entrega cerca de 102 gigaflops de desempenho de 2 watts, ou 51 gigaflops por watt. (Adapteva escolheu GlobalFoundries como wafer padeiro, por sinal.)


A arquitetura de memória Epifania permite que qualquer núcleo para acessar a SRAM de qualquer outro núcleo no die porque a SRAM é mapeado como um único espaço de endereço através dos núcleos. Isso simplifica muito o gerenciamento de memória, e tem um acesso direto à memória (DMA) unidade que pode pré-busca de dados da memória flash externo.


Como os elementos de computação do conselho Parallella se reúnem

Como os elementos de computação do conselho Parallella se reúnem



No momento, este suporte DMA não é estendido para InfiniBand ou adaptadores de rede Ethernet com Remote Direct Memory Access (RDMA) sobre esses dois protocolos de rede, mas Olofsson admite a El Reg que este apresenta um interessante conjunto de possibilidades para ligar vários co-processadores em um cluster Parallella juntos e ter a epifania coprocessadores compartilhar dados diretamente na rede como mastigar dados. (Você usaria o RDMA sobre Convergente Ethernet, ou RoCE, nos links Ethernet).


O conselho não tem uma porta SATA ou InfiniBand rápido ou link Ethernet, mas três das quatro portas de expansão 10Gb/sec pode ser encurralaram juntos para um máximo de 30Gb/sec de largura de banda para anexar outros tipos de portas para o conselho Parallella . Você teria que criar o cartão filha para fazer isso e escrever seus drivers.


O ARM-FPGA-Epiphany bordo híbrido triplo Parallella-16

O ARM-FPGA-Epiphany bordo híbrido triplo Parallella-16



O projeto Epiphany-IV é destinado a dimensionar a 64 núcleos de 1 GHz e queimar cerca de 25 miliwatts por núcleo. O chip atual é executado em 800MHz e entrega que 51 gigaflops de desempenho por watt sobre o trabalho números impressionantes mencionado acima. De 1 GHz, o Epiphany-IV pode fazer uma estimativa de 70 gigaflops por watt.


Se você participou do programa Kickstarter, você receberá uma placa Parallella-16 com um Zync-7020 processador da Xilinx, que tem dois núcleos Cortex-A9 que rodam a 800MHz e um FPGA no mesmo pacote com 85.000 células lógicas e 220 programável Fatias de processamento de sinais digitais. Esta placa tem um dos processadores Epiphany-III 16-core nele também, e esportes 1GB de memória principal SDRAM, um slot para cartão MicroSD, quatro conectores de expansão, uma placa de interface de rede Gigabit Ethernet e um conector HDMI.


Se você quiser comprar uma placa Parallella-16 e você não participar do programa Kickstarter, você pode obter um da loja on-line que Adapteva criou, mas você vai ter um processador Zync-7010 em vez disso, que tem apenas 29 mil lógica células e 80 DSP fatias na lateral do chip FPGA Xilinx.


Isso levará cerca de 12 semanas para cumprir essas ordens, porque não é Adapteva placas pré-fabricação. Isso vai custar US $ 99, assim como o nível de base do apoio Kickstarter fez. Você vai finalmente ser capaz de ordenar o chip Zync com o FPGA mais gordo, mas os preços ainda não está definido para este upgrade.


Um cluster de 42 nós de Parallella-16 placas de Adapteva

Um cluster de 42 nós de Parallella-16 placas de Adapteva



Se você não quer fazer muito trabalho em tudo e quer começar a jogar com um cluster de bebê dessas placas do sistema Parallella-16, Adapteva está vendendo as também por US $ 575. Que inclui quatro dos Parallella-16 cartões com conectores, quatro cartões SD de 16GB carregado com da Canonical Ubuntu Server 12.04, uma fonte de alimentação e 20 de metal impasse pernas para estragar as placas em uma torre de poder de computação. O cartão Parallella-16 é de apenas 3,4 polegadas por 2,1 polegadas.


O projeto Parallella necessário Epifania embalagem chip para ser redesenhado, Olofsson diz El Reg, e os drivers e SDK também foram melhorados e obrigadas a trabalhar melhor com os FPGAs sobre os chips Xilinx. Essa pilha inclui um compilador C, um depurador multicore, o Eclipse IDE, uma OpenCL SDK e set compilador e as bibliotecas de tempo de execução.


Apenas por diversão, Olofsson pegou dois switches Gigabit Ethernet de 24 portas e 42 das placas Parallella para criar um cluster de 42 nós que é aproximadamente do tamanho de um PC torre. Ele vai custar cerca de US $ 5.000 e queimar menos de 500 watts (em todos, incluindo os três tipos de processamento, memória, armazenamento flash e portas Ethernet).


Essa máquina proporciona cerca de 1,1 teraflops de glamour, e mudando para o 64-core Epiphany-IV que levaria até 4,3 teraflops. Isso não é um monte de teraflops, e um monte de co-processadores GPU pode combinar que, em um fator de forma muito menor para ter certeza. Mas o esmagamento RISC coprocessador é mais do que o dobro da eficiência de energia, de acordo com Adapteva.


Adapteva ainda quer ser um jogador de exascale na área de computação de alto desempenho, e como El Reg já relatado anteriormente, ajustou suas vistas sobre a criação de dois chips em 2018 para atingir suas aspirações exascale. Um chip de futuro Epiphany é um co-processador de entrada com mil núcleos em um dado que oferece 2 teraflops de desempenho em um envelope térmico 2 watt. O segundo é um chip enorme, com 64 mil núcleos com 1 MB de SRAM por núcleo que pode entregar 100 teraflops de coprocessamento de ponto flutuante com 100 watts. O plano é ter os dois chips oferecem um teraflops por watt usando os sete nanômetros processos de cozimento wafer que se espera estar disponível em 2018.


O programa Kickstarter para estes futuros chips Epiphany provavelmente exigirá algum apoio de grandes agências governamentais. E com esse tipo de desempenho e números térmicas, a Defense Advanced Research Projects Agency dos EUA é, provavelmente, farejando, e, talvez, o Departamento de Energia, também. ®







via Alimentar (Feed) http://go.theregister.com/feed/www.theregister.co.uk/2013/07/25/adapteva_parallella_arm_fpga_epiphany_boards/

Nenhum comentário:

Postar um comentário