História da Intel

História da Intel
Logo da Intel

A história dos processadores, desde ENIAC até Nehalem

Segundo Gordon Moore, co-fundador da Intel e autor da lei que leva seu nome, os novos processadores Nehalem da Intel representam o maior avanço na tecnologia aplicada a transistores desde a década de 60. Estes processadores, com um tamanho menor que o da unha de um dedo, são o resultado de um avanço tecnológico que começou há alguns anos atrás com computadores maiores e de menor capacidade.

Com a introdução de materiais totalmente novos, como os circuitos baseados em Háfnio, alcançaram uma redução de até 30% na perda de energia em comparação aos processadores de gerações anteriores.

O primeiro computador eletrônico foi o ABC (Atanasoft Berry Computer), construído em 1937 pelo doutor Vincent. V. Atanasoft e Clifford E. Berry. Pesava 320 Kg e ocupava o espaço de uma mesa. Sua principal função era resolver problemas de álgebra com maior exatidão.

Em 1946 foi apresentada publicamente a ENIAC (Electronic Numerical Integrator and Computer), criada por John Presper Eckert e John William Mauchly. Tratava-se de um colosso de 167m2 e pesava 27 toneladas, cujo funcionamento podia elevar a temperatura ambiente a 50ºC. Diferentemente de seus contemporâneos, a ENIAC prescindia completamente de processos analógicos.

Durante as décadas de 50 e 60 gerou-se outro grande avanço: os computadores deixaram de funcionar á base de tubos a vácuo e começaram a utilizar circuitos transistores.

Inventados em 1947 por William Shockley, John Bardeen e Walter Brattain, os transistores são pequenos interruptores de transmissão elétrica. O desenvolvimento de circuitos integrados permitiu, em 1971, o aparecimento do primeiro microprocessador, o 4004 da Intel, que continha 2000 transistores.

EVOLUÇÃO HISTÓRICA DOS PROCESSADORES

1937: 1937 ABC (Atanasoff Berry Computer), primeiro computador elétrico
1946: ENIAC (Electronic Numerical Integrator Computer), primeiro sem processos analógicos
1947: Introdução dos transistores
1971: Aparece o primeiro microprocessador, o 4004 da Intel®, com 2000 transistores.
1981: Lançamento do processador 8088 da Intel®, o primeiro com 16 bits.
1982: Processador Intel® 286, com 139.000 transistores
1985: Surgimento do Intel® 386, o primeiro que permitiu a execução de múltiplas tarefas.
1991: Lançamento do Processador Intel® Pentium® com 3 milhões de transistores
1999: O triplo de transistores, com o Processador Intel® Pentium® III
2001: Primeiros processadores de 90nm fabricados com Silício
2005: Primeiro processador multicore do mercado: o Intel® Pentium® D
2006: Processador Intel® Core™2 Duo, fabricado em 65nm
2007: Lançamento do Intel® Core™2 Quad, primeiro processador com quatro núcleos
2008: A era dos 45nm

Em 1981 apareceu o processador 8088 da Intel. O mesmo era de 16 bits, trabalhava com um máximo de 10MHz e dispunha de 29.000 transistores. Um ano depois, o processador Intel® 286, que contava com 39.000 transistores, foi lançado no mercado.

A Intel desenvolveu em 1985 um processador que dispunha de 287.000 transistores, ou seja, cem vezes mais que o processador 4004 de quinze anos atrás: era o Intel® 386, que com seus 32 bits foi o primeiro que permitiu a execução de tarefas múltiplas.

O Processador Intel® Pentium® foi lançado em 1991. Ocupava uma superfície de 0.8 micron e continha 3 milhões de transistores. Oito anos depois a quantidade de transistores passou a ser três vezes maior (9.5 milhões) com o Processador Intel® Pentium® III.

No começo do novo milênio, a Intel encontrava-se desenvolvendo processadores de 90nm que ofereciam um maior desempenho e um menor consumo de energia. Foram os primeiros processadores fabricados com Silício.

Em 2005 surgiu o primeiro processador multicore do mercado: o Intel® Pentium® D.

Foi o começo da tecnologia Dual-Core em microprocessadores, que um ano depois levou ao desenvolvimento do processador Intel® Core™2 Duo. Seu processo de fabricação de 65nm permitiu que se chegasse a dispor de até 290 milhões de transistores.

Os avanços na tecnologia multicore continuaram seu curso e os processadores de quatro núcleos Intel® Core™2 Quad fizeram sua aparição em 2007.

Desta forma, a liderança da Intel novamente traduziu-se em um maior desempenho para o usuário, que agora pode aproveitar ao máximo a experiência multimídia.

Finalmente, chegou a era dos 45nm em 2008, conhecidos sob o código de Nehalem. Os menores processadores do mundo, que usam o Háfnio como componente, foram implementados no desenvolvimento do Intel® Core™ 2 Duo, Intel® Core™2 Quad, Intel® Xeon® e também na linha mais recente de processadores, Intel® Atom™, que representa a maior inovação dentro da eletrônica nos últimos 40 anos.

As inovações na arquitetura da informática permitiram que um poder muito maior que o daquele enorme colosso ENIAC aparecesse em um microchip menor que a ponta de um dedo. Assim, os Processadores Intel de 45nm são a nova era dentro do avanço tecnológico no qual a Intel continua fazendo história.

Fonte: www.intel.com

História da Intel

História da Companhia

Intel Corporation, fabricante americana de circuitos de computador de semicondutores. Ela está sediada em Santa Clara, na Califórnia. O nome da empresa vem de “eletrônica integrada.”

Intel Corporation é a maior fabricante de semicondutores do mundo, com grandes instalações nos Estados Unidos, Europa e Ásia. Intel mudou o mundo dramaticamente desde que foi fundada em 1968; a empresa inventou o microprocessador, o “computador em um chip”, que tornou possível as primeiras calculadoras portáteis e computadores pessoais (PCs).

Até o início do século 21, os microprocessadores da Intel foram encontrados em mais de 80 por cento dos PCs em todo o mundo.

A linha de produtos da empresa inclui também chipsets e placas-mãe; memória flash usados em comunicações sem fio e outras aplicações; hubs, switches, roteadores e outros produtos para redes Ethernet; e incorporado chips de controle utilizados em produtos de rede, impressoras laser, dispositivos de imagem, meios de armazenamento, e outras aplicações.

Intel manteve-se competitiva através de uma combinação de marketing inteligente, pesquisa e desenvolvimento bem suportado, proficiência de fabricação superior, uma cultura corporativa vital, proficiência jurídica, e uma aliança permanente com gigante do software Microsoft Corporation muitas vezes referida como “Wintel”.

Os fundadores da Intel, Robert Noyce e Gordon Moore, estavam entre os oito fundadores da Fairchild Semiconductor, fundada em 1957. Enquanto estava na Fairchild, Noyce e Moore inventou o circuito integrado, e, em 1968, eles decidiram formar a sua própria empresa.

Eles logo foram acompanhados por Andrew Grove, um refugiado húngaro, que havia chegado nos Estados Unidos em 1956 e se juntou a Fairchild em 1963.

Grove permaneceria presidente e CEO da Intel na década de 1990.

História da Intel

A Intel, hoje, é uma empresa com mais ou menos 100.000 funcionários fundada em 1968 por Gordon E. Moore. Especializada em produzir chipsets, circuitos integrados e principalmente microprocessadores. Sua sede fica localizada na cidade de Santa Clara na Califórnia, Estados Unidos. Hoje pode ser considerada uma das maiores empresas do mundo, produzindo não só chipsets, circuitos integrados e microprocessadores, mas também soluções direcionadas a todos os tipos de público.

O que gerou à Intel, no ano de 2005, quase 40 bilhões de dólares em lucros. Essa empresa tão poderosa começou produzindo circuitos integrados de memória RAM e depois de alguns anos, com a aparição do microprocessador, finalmente entrou no bilionário mercado dos processadores: com o 4004.

4004

Feito em 1971, era composto de apenas 2.300 transistores. Ele operava aos ‘incríveis’ 740 KHz e apesar de simples, serve até hoje para programar uma inteligência artificial em objetos inanimados e por isso, pode ser denotado de ‘revolucionário’. Afinal também marcou uma época onde o mercado de chips crescia e a computação pessoal estava cada vez mais perto de acontecer.

Um fato curioso é que ele tinha o mesmo ‘poder de fogo’ do ENIAC e pesava algumas gramas , enquanto o ENIAC: 30 toneladas. Já era algo extremamente avançado, não?

4040

O Intel 4040 se trata de um processador mais avançado que o 4004. Lançado em 1972 porém rodando na mesma velocidade que o 4004. Ele foi usado no sistema de desenvolvimento Intellec 4/40.

8008

Em abril de 1972 surge o microprocessador Intel chamado de 8008. Ele vinha com clocks de até 800 KHz (notem, nem era MHz, era KHz). Possuía também 3.500 transistores e tinha capacidade de processar até 16 kilobytes de memória.

8080

Com o 8080, em 1974, a Intel finalmente consolidou no mercado o primeiro chip considerado em real como um microprocessador. Com 4.500 a 6.000 transistores e com clocks de até 2 MHz, significou um processador 10 vezes mais rápido do que seus antecessores. No 1975 o 8080 foi usado em um dos primeiros computadores pessoais. Chamado de Altair 8800 ele era vendido a 439 dólares.

8085

O 8085 foi introduzido no mercado pela Intel no ano de 1976 com clocks que podiam chegar aos 5 MHz. Com 6.500 transistores e 8 bits de instruções

8086

Já no ano de 1978 chegaram os primeiros processadores com 16 bits de instrução e 28 mil transistores. Chamado de 8086 ele veio a calhar um padrão no mercado da computação pessoal. Tinha clocks de até 10 MHz.

8088

No ano de 1979 a Intel foi obrigada a colocar apenas 8 bits de instruções por causa dos usuários que tinham placas mãe mais antigas, com a crição do 8088 e seu sucesso respectiva, no ano de 1981 a poderosa IBM selecionou-o para sua linha de computadores pessoais: IBM PC. Isso elevou a Intel a um grande patamar de importância, afinal a IBM era o que havia na época no mundo da computação e agora com 10 anos de idade ela tinha mais experiência do que nunca para vir a se tornar no futuro a maior produtora de microprocessadores do mundo.

80186

Introduzido pela Intel em 1982. As primeiras versões tinham apenas 6 MHz de clock e era considerado uma evolução do 8086 pois trouxe vários novos recursos, chegou ao meracado onde chipsets compatíveis já eram consolidados e trouxe finalmente os 16 bits prometidos.

80188

Também de 1982, tinha apenas 8 bits de comunicação externa.

80286

Mais um processador de 16 bits só que agora com 134 mil transistores e muito mais capacidade de processamento. Também chamado simplesmente de 286 fez um sucesso numeroso. Ele foi introduzido pela Intel em 1982. Com edições de 6 MHz a 8 MHz e depois para 12.5 MHz. Foi desenhado também para trabalhar com operações multitasking e multiuser. Uma curiosidade sober o 286 é que ele foi o primeiro processador x86 a poder trabalhar o modo real e o modo protegido. Que seria, dentro do sistema operacional, poder acessar o DOS assim sendo era uma emulação de sistemas que operavam em computadors mais velhos como o 8088 e 8086.

386

No ano de 1986, entramos nos 32 bits de processamento com o 386. A primeira empresa a implicar em seus computadores pessoais o ‘potente’ 386, foi a Compaq. Com capacidade agora de até 4 GB de memória ele tinha a versão econômica, chamada de SX e também a versão econômica um pouco mais modernizada, chamada de DX.

Os nomes ficavam assim: 386 SX e 386 DX. Ele tinha uma variante para computadores móveis, já na época surgiam os primeiros notebooks, essa variante era a SL, portanto, 386 SL.

486

Já com a computação de 32 bits consolidada, o 486 foi lançado. Muito similar ao 386, tinha algumas melhorias nas suas intruções em geral e agora com a capacidade de trabalhar com um co-processador matemático adicional, que poderia-se comprar separado. Se tratava de um processador adicional que ajudava nos cálculos matemáticos e aumentava consideralmente o desempenho do processador. Aparecia com versões SX, DX e SL também. Uma outra novidade nos processadores 486 foi o surgimento da possibilidade de multiplicar o clock externo do processador, ou seja, a velocidad e com que o processador se conectava com a memória.

Então vieram versões DX-2 e semelhantes, onde o 2 significava que o clock externo era multiplicado por 2, mas tome cuidado para não confudir por exemplo quando lançaram algumas versões onde o clock interno estava estampado ao lado, por exemplo Dx-25, isso significaria que ele tem 25 MHz, podendo aparecer multiplicador junto de clock também. O maior clock dos 486 era de 100 MHz. Onde tinhamos clock externo de 25 MHz e multiplicador 4. Versões 486 DX-4 100.

Pentium/586

Em 1993, veio o sucessor do 486, foi chamado inicialmente de 586 mas por não poderem registrar números, ele foi chamado de Pentium. O nome provavelmente veio do grego ‘pent’ que significa 5, pois ele era um processador de 5° geração. Com 3,100.000 transistores, os primeiros Pentiums, chamados de P5, inicialmente com 16KB de cache L1 foram lançados com clocks de 66 MHz e 60 MHz.

Mais tarde, foram surgindo gradualmente versões de 75, 90, 120, 133, 150, 166, 200, e 233 MHz. Versões de 266 e 300 MHz foram posteriormente lançadas para uso em computadores portáteis.

Aqui é utilizado o socket 7 ou 321.

Processadores Pentium OverDrive foram lançados com velocidades de 63 e 83 MHz como uma opção de upgrade para computadores 486 mais antigos.

Pentium Pro

Em 1995, a Intel trouxe ao mercado o processador Pentium Pro, já com arquitetura diferente do Pentium clássico. O Pentium Pro foi o primeiro processador com arquitetura RISC, com 50% de desempenho. Era pra ter sido o sucessor do Pentium e competir no mercado de alto desempenho. Foi o primeiro processador a conter o cache L2 dentro do processador. Foi considerado também o primeiro processador da família do Pentium II e teve versões de até 200 MHz e cache L2 de 1 MB.

Pentium MMX

Com o tempo e as atualizações, em 1997, o Pentium clássico foi aprimorado pelo centro de pesquisa e desenvolvimento da Intel em Haifa, Israel, aplicando-se a tecnologia MMX (Pentium MMX).

A tecnologia MMX basicamente seria a inclusão de 57 novas instruções ao conjunto de instruções do processador e o aumento do cache L1 dos pentium do 16KB para 32KB.

O MMX trabalha com um novo conceito: SIMD (Single Instruction, Multiple Data – Instrução simples para múltiplos dados). De uma só vez, diversas operações simples e de dados curtos podem ser feitas simultaneamente. Processo com filtros, efeitos especiais, separação das cores e animações são apenas alguns dos exemplos práticos da rapidezque essas novas 57 instruções trazem.

Pentium II

Ainda em 1997, mas agora com nova arquitetura, saindo do MMX. Temos o lançamento do Pentium II no mês de maio.

O pentium II segue a arquitetura do Pentium Pro, portanto com codinome P6. Primeiro ele apareceu em versões de cartucho, chamadas SECC. Dentro do cartucho tinha o processador e a memória cache L2 uma em cada chip, sendo assim a cache L2 trabalhava na velocidade do clock interno. Essa versão, chamada de Pentium II Desktop ia de 233 MHz até 400 MHz, dependendo do modelo. Depois lançaram o Pentium II Xeon, direcionado para servidores e ia até 450 MHz com mais cache L2. Já para o mundo móvel, lançaram o Modile Pentium II que ia até de 300 MHz para 400 MHz, dependendo do modelo.

A arquitetura chamada ‘Deschutes’ foi utilizada do Pentium II de 350 MHz até o de 450 MHz, e o Pentium III se baseou nela.

Pentium III

Baseado na arquitetura ‘Deschutes’ dos Pentium II, chega no mercado o Pentium III, em janeiro de 1999. As primeiras versões usavam um núcleo chamado Katmai e possuíam versões versões de 450, 500, 550, ou 600 Mhz .Uma segunda versão do Pentium III foi lançada, com núcleo de arquitetura mais avançada, batizado de Coppermine, permitiu ao Pentium III alcançar clocks de 650, 667, 700, 733, 750, 800, 850, 900 Mhz e 1 Ghz. Velocidades pelas constantes miniaturações dos transistores que compunham o processador de 0,25 mícron do Katmai para 0,18 no Coppermine. A terceira versão do Pentium III veio com o núcleo Tualatin, de 0,13 mícron. Também chamado de Pentium III – S.

Com versões de: 1.0, 1.13, 1.2, 1.26, 1.33 e 1.4 GHz. Todos os Katmai usavam slot de cartucho também, já os Coopermine também tinha opção de socket 370. E o Tualatin somente de socket.

Pentium 4 – Willamette

No ano de 2000, a Intel lança o Pentium 4. Além de mudanças radicais na arquitetura como um pipeline maior com o objetivo de obter-se clocks maiores, vieram também novas instruções, as instruções SSE2. O primeiros Pentium 4, com o núcleo “Willamette”, possuía versões de 1.30 até a 2.0 GHz e foi lançado em Novembro de 2000 no Socket 423, mas depois ainda sim surgiram versões com o socket 478, que apesar de ter mais sockets os chips eram menores. Ele veio cotado para ser uma grande revolução, mas para surpresa de muitos, além do atraso no desenho da arquitetura, ele teve um desempenho se não igual, até inferior que o Pentium III Tualatin e os seus concorrentes diretos, os Athlon. Os Willamette que superaram o Pentium III vieram a ser lançados apenas no ano de 2001, a partir da versão de 1.7 GHz. O Willamette era produzido sob a nometria de 180nm e tinha cache L2 de 256KB, podendo trabalhar até a 400 MHz no barramento externo. Com 42 milhões de transistores o metal utilizado utilizado para fazer a conexão entre eles era o alumínio.

Assim, finalmente, entramos na 7° geração de processadores. A arquitetura dessa geração foi chamada de Netburst.

Pentium 4 – Northwood

Em outubro de 2001 a Intel lança um núcleo com processo de fabricação de 130nm. Tinham caches L2 que iam de 512 KB a 2 MB e barramento externo rodando a 400 MHz, 533 MHz ou 800 MHz, tudo dependia de qual versão era. Esse era o competir direto com o Athlon XP que até então andava ganhando dos núcleos Willamete, mesmo os acima de 1.7 GHz.

Esse processador fazia o uso de 55 milhões de transistores e o metal utilizado para fazer a conexão entre os transistores era o cobre. Sendo assim, com todas essas características, esse núcleo ficou conhecido como o mais neutro da linha dos Pentium 4 e foi considerado o que menos tinha dissipação de calor.

Os clocks nos processadores Northwood vão de 1.60 GHz até a 3.4 GHz. Todos usam socket 478, com excessão de uma versão de 3.40 GHz que usa o socket novo, até então, 775 ou então socket T. Aliás, por falar nessa versão 775, é o único dos Northwood que tem 2MB de cache L2 e pelo menos 40 W a mais também de consumo energético do que as versões mais básicas. A partir processador de 2.80 GHz alguns outros apareceram com suporte à tecnologia Hyper-threading[HT] (tecnologia usada inicialmente no Xeon), permitindo o processamento de diferentes tarefas simultaneamente duplicando algumas partes do processador de modo que o sistema operacional pensar que existem dois processadores é como um dual core simulado. A partir do lançamento do Prescott, quase todos tinham HT.

Pentium 4 – Prescott

Já com as novas instruções SSE3, a Intel lança em fevereiro do ano de 2004 o núcleo Prescott, muito conhecido pela alta dissipação energética e altas temperaturas causadas então. Ele tinha versões de 512 KB, 1 MB e 2 MB de cache L2. O metal utilizado paras as conexões dos seus 125 milhões de transistores era o cobre ainda e utilizava uma nanometria de 90nm, o que permitiu maior quantidade de transistores no caso dobrou em relação aos Northwood.

Uma curiosidade é de que a partir da versão de 2.80 GHz todos os prescotts tinham HT. A maioria das versões do pentium 4 com núcleo prescott usam o socket LGA 775 ou também chamado de socket T, mas também tem versões com socket 478. Os clocks podem ir de 2.26 GHz até a 3.80 GHz, dependendo da versão. Ele não obteve o resultado esperado de desempenho e ao mesmo tempo ele acaba esquentando demais, abrindo as portas para AMD produzir processadores melhores adaptados para as necessidades dos usuários comuns, também por possuírem menores preços. A partir dos prescotts versão 630, começamos a ter instruções de 64 ativados e a Intel deu início à concorrência direta com os Athlon 64 da AMD.

Também dando início ao duas tecnologias: tecnologia SpeedStep que visa diminuir os clocks e a voltagem enquanto o computador fica ocioso, assim diminuindo o gasto de energia e também a tecnologia eXecutable Disable or habilitable que é uma tecnologia que visa a segurança.

Pentium 4 Extreme Edition

O Pentium 4 EE foi lançado em 2003 e ficou conhecido como o primeiro processador a ter cache L3 integrado. Ele possuía 2 MB de cache L3, acessado na mesma freqüência de operação interna do processador. Os primeiros modelos de P4 EE tinham núcleos Gallatin com 512 KB de cache L2 e trabalhavam externamente em 800 MHz até 1.066 MHz, dependendo da versão e tinha 178 milhões de transistores, construído à 130nm. Já os atuais, construídos com núcleo Prescott 2M, tem a tecnologia de 90nm e possibilitam mais transistores. Eles possuíam 169 milhões de transistores. Todas as versões do EE possuem a tecnologia HT. O EE é muito conhecido pelo seu salgadíssimo preço e um desempenho nem tanto satisfatório, perdendo até para os Athlon 64 medianos.

Pentium 4 – Cedar Mill

Esse núcleo surgiu com algumas versões dos 6xx de 64 bits no começo de 2006. Sua tecnologia é de 65nm e sua arquitetura conseguiu milagrosamente resolver os problemas de dissipação de calor do Prescott. Agora o Pentium 4 vem acompanhada também da tecnologia de virtualização que permite o uso de vários sistemas operacionais na mesma máquina.

Ele tem versões de 3.0 Ghz a 3.60 GHz e tem se mostrado uma fera no overclocking, com testes recentes feitos por estrangeiros. Esse núcleo ainda é muito imaturo no Brasil e chegou apenas em países de primeiro mundo por enquanto. É de esperar ansiosamente pela sua chegada.

Fonte: www.fundinguniverse.com/www.soldat.com.br

História da Intel

Evolução dos Processadores

Introdução

A pesquisa a seguir vai mostrar o processo evolutivo dos processadores, que nada mais é que um pedaço de silício com inúmeros condutores começando do famoso Eniac computador formado por válvulas que ocupava uma sala inteira até os processadores mais avançados, como os Pentium 4 e os novos AMD K7 que são menores que um mouse.

As quatro principais divisões do documento vai ser pelas respectivas empresas: Intel, AMD (Advanced Micro Device), e Cyrix que são as maiores do ramo bem como empresas secundárias, sendo cada uma delas mostrando os primeiros processadores até os últimos modelos e previsões futuras.

Eniac o Pai dos Computadores Modernos

Charles Babbage, considerado o pai do computador atual, construiu em 1830 o primeiro computador do mundo, cem anos antes de se tornar realidade. O projeto de Babbage apresentava desvantagens; uma delas era o fato de que o seu computador deveria ser mecânico, e a outra era a precariedade da engenharia da época. Apesar dos problemas, Charles Babbage construiu um aparelho que impressionou o governo inglês. Entretanto, a história da computação começou muito antes. Como sabemos, o computador é uma máquina capaz de efetuar cálculos com um grupo de números e ainda adaptável para efetuar novos cálculos com um outro grupo de números. O primeiro “modelo” foi o ábaco, usado desde 2000 a.C. Ele é um tipo de computador em que se pode ver claramente a soma nos fios.

Blaise Pascal, matemático, físico e filósofo francês, inventou a primeira calculadora mecânica em 1642. A calculadora trabalhava perfeitamente, ela transferia os números da coluna de unidades para a coluna de dezenas por um dispositivo semelhante a um velocímetro do automóvel. Pascal chamou sua invenção de Pascalina.

Nos anos que se seguiram, vários projetos foram feitos com intuito de aperfeiçoar essa primeira calculadora. Entretanto, nada de significativo aconteceu, até que Babbage e Ada Lovelace começaram a considerar melhor o problema. Em 1822, Babbage apresentou a Sociedade Real de Astronomia o primeiro modelo de uma máquina de “diferença”, capaz de fazer cálculos necessários para elaborar uma tabela de logaritmos. O nome da máquina foi derivado de uma técnica de matemática abstrata, o método das diferenças.

Com o incentivo da sociedade, Charles Babbage continuou a trabalhar no aperfeiçoamento da máquina.

Com Ada Lovelace, filha de Lord Byron, iniciou um projeto mais ambicioso para construir uma “máquina analítica”. Foi projetada para calcular valores de funções matemáticas bem mais complexas que as funções logarítmicas. A máquina era enorme, demostrava inúmeros problemas e simplesmente não funcionava. Grande parte da arquitetura lógica e da estrutura dos computadores atuais provém dos projetos de Charles Babbage, que é lembrado como um dos fundadores da computação moderna.

Só por volta de 1936, as idéias de Babbage foram comprovadas, quando um jovem matemático de Cambridge, Alan Turing, publicou um artigo, pouco conhecido, On computable numbers.

O nome de Turing é quase desconhecido para o público, mas sua contribuição foi fundamental para o desenvolvimento de idéias que ocorreriam antes do computador propriamente dito tornar-se realidade. Os cientistas admitiam que a matemática não era uma arte misteriosa, e sim uma ciência inteiramente relacionada com regras lógicas. Se uma máquina recebesse essas regras e o problema a ser solucionado, ela seria capaz de resolve-lo.

No entanto, os esforços dos mais competentes matemáticos foram inúteis para desenvolver tal máquina. Turing decidiu examinar o impasse de outra maneira.

Verificou os tipos de problemas que uma máquina poderia resolver seguindo regras lógicas, e tentou fazer uma lista de todos eles.

Turing liderou uma equipe de pesquisa na Inglaterra e desenvolveu a mais secreta invenção da Segunda Guerra Mundial, o Colossus, o primeiro computador eletromecânico do mundo, que pode decifrar os códigos alemães de mensagens “Enigma”, durante a guerra, melhor apresentado abaixo. Depois da guerra, Turing colaborou no projeto do primeiro computador dos Estados Unidos, o Eniac (Eletrical Numerical Integrator and Calculator), desenvolvido na Universidade da Pensilvânia desde 1943.

Ainda imperfeito, era composto de 18000 válvulas, 15000 relés e emitia o equivalente a 200 quilowatts de calor. Essa enorme máquina foi alojada em uma sala de 9m por 30m. O desenvolvimento do computador continuou, mas só com a invenção do transistor de silício, em 1947, tornou-se possível aumentar a velocidade das operações na computação.

Em meados dos anos 60, os cientistas observaram que um circuito eletrônico funcionaria de modo igualmente satisfatório se tivesse o tamanho menor. Os laboratórios começaram experimentando a colocação de um projeto de circuito no chip. Antes do fim dos anos 60, nasceu o “circuito integrado”, com isso a computação deu um grande passo à frente. O desenvolvimento de um circuito em um único chip levou à construção de múltiplos circuitos em um só chip; e o resultado inevitável da colocação de vários chips juntos foi o começo do microprocessador.

Diferenças entre os Eniacs:

Componente	Eniac	Eniac II Chip
Tubos de Vácuo	18.000	Não Tem
Transistors	Não Tem	250.000
Resistors	170.000	Não Tem
Capacitores	10.000	Não Tem
Velocidade do Clock	100 KHz	20 MHz
Energia para operar	174 Kw	0.5 W

Um outro grande projeto da época, anterior ao ENIAC e por isso pioneiro, foi o Colossus, desenvolvido na Inglaterra no período de 1939 a 1943 com a intenção de quebrar o código da máquina de criptografia alemã denominada Enigma, que gerava seqüências aleatórias com período de 1019 caracteres. Deste projeto, tomou parte Alan Turing, certamente um nome conhecido hoje em dia. Após a guerra, esse projeto foi descontinuado, mas permaneceu secreto até 1973. Dizem que, se esse projeto fosse publicado logo após a término da guerra, teríamos hoje uma grande indústria inglesa de computadores.

O termo bug que sempre , foi usado pelos engenheiros para indicar pequenas falhas em suas máquinas. Já em 1870, Thomas Edison falava de bugs em seus circuitos elétricos. Em 1947, os engenheiros que trabalhavam com o Harvard Mark I encontraram uma traça entre seus circuitos, prenderam-na no livro de registro e rotularam-na como o primeiro bug encontrado.

Já na área dos microcomputadores, perguntamo-nos: qual foi o primeiro ?

Em 1975 a Revista Popular Electronics apresentou o projeto e anunciou a venda do kit do primeiro microcomputador. Era o Altair 8800, baseado no microprocessador 8008 da Intel.

O nome Altair é uma homenagem ao planeta onde se passa o filme Planeta Proibido (1956). Foi também) para esse microcomputador que a dupla Paul Allen e Bill Gates vendeu um de seus primeiros produtos: um interpretador Basic.

Processadores

Linha do Tempo

1968 – A empresa Intel é fundada por Robert N. Noyce, Gordon E. Moore e Andrew Grove. Robert N. Noyce foi o inventor do circuito integrado. 1969 – A 3101 RAM de 64 bits é desenvolvida pela Intel. 1970 – A Dinamic é desenvolvida pela Dinamic RAM. 1971 – É desenvolvido o Microprocessador 4004 de 4 bits e EPROM 1702. 1972 – É desenvolvido o Microprocessador 8008 de 8 bits. 1974 – É desenvolvido o Microprocessador 8080 de 8 bits. 1976 – É desenvolvido o 8748/8048, o 1o. Microcontrolador. 1976 – É desenvolvido o Microprocessador 8085 de 8 bits. 1978 – É desenvolvido o Microprocessador 8086 de 16 bits. Surge aqui a era dos TV games (futebol, tênis, paredão, etc). 1979 – É desenvolvido o Microprocessador 8088 de 8 bits. 1980 – É desenvolvido o Co-processador matemático 8087. 1981 – É desenvolvido o Microcomputador IBM-PC baseado no 8088. A IBM licencia o MS-DOS como sistema operacional do PC.

No Brasil

É desenvolvido o Sistema 700 da Prológica com 2 CPUs Z80 da Zilog e 64k.
É desenvolvido o NE Z80 com 1k, expansível até 16k, gravador cassete, TV, com 102 funções.
É desenvolvido o CP 500 com 48k, disquetes e RS 232.

A revista Time escolhe o computador como o Homem do Ano.

1982:

É desenvolvido o Microprocessador 80286 de 16 bits.
Surge o Arquivamento Óptico.
O Microcomputador 80186, usado em aplicações de controle.
É desenvolvido o NE Z8000 com 8k.
É desenvolvido o CP 200 e TK 82C da Microdigital com 64k, joystick, som, impressora e disquetes.

1983: A Microsoft lança o Windows, que tornou o DOS mais fácil de ser usado.

1984: É desenvolvido o IBM PC-AT baseado no 80286.

1985: É desenvolvido o Microprocessador (carinhosamente apelidado de “Três-oitão).

1986: É desenvolvido o Compaq PC 386

1987:

A IBM-MS (Joint Development Agreement) OS/2 assinam um acordo desenvolvimento conjunto.
São desenvolvidos o Windows 2.0, Excel e o Bookshelf, os quais ultrapassam 500 milhões de dólares.

1988:

É desenvolvida a Memória com tecnologia Flash.
Os HD’s atingem a incrível marca dos 380 MB.
Surge a febre dos vírus.
A Apple anuncia que levará a Microsoft aos tribunais.
É desenvolvido o Microprocessador 80386 SX com largura do barramento de 16 bits.

1989: É desenvolvido o Microprocessador 80486DX de 32 bits, com clock de 25 MHz e 20 MPIS, uma performance 50 vezes maior que o 8088.

1990: É desenvolvido o Windows 3.0, cujas vendas ultrapassam 1 bilhão de dólares.

1991: É desenvolvido o 80486 SX.

1992: São desenvolvidos os Processadores 80486 DX2 de 32 bits, com clock de 50 MHz e 41 MPIS, e o Processador 486 DX2-66 com 1,2 milhões de transistores.

1993: É desenvolvido o Processador Pentium de 60 e 66 MHz. É desenvolvida a versão empresarial do Windows, encarta em CD-ROM.

1994 – São desenvolvidos os Processadores Pentium 90 e 100 MHz, e o Processador 486 DX4 de 32 bits, com clock de 100 MHz e 70,7 MPIS.

1995: É desenvolvido o Processador Pentium Pro de150, 166, 180 e 200 MHz, além de ser desenvolvido o Windows 95.

1996: É desenvolvido o Processador Pentium Pro de 200 MHz.

1997:

Janeiro: É desenvolvido o Pentium MMX Tecnology de 166 e 200 MHz com barramento externo de dados de 64 bits e endereçamento de 32 bits.
Junho: É desenvolvido o Pentium MMX de 233 MHz.
Maio: É desenvolvido o Pentium II de 233, 266, 300 MHz, tecnologia de encapsulamento de cartucho S.E.C. (Single Edge Contact). Ela combina as tecnologias do Processador Pentium Pro com a MMX. A tecnologia AGP acelera a velocidade de tráfego de dados do processador para as placas gráficas.
É desenvolvido o DVD (Digital Video Disc) com capacidade para 7 a 28 vezes mais informações que os CDs musicais e cd-rom’s de computador.
Julho: É citado o nome Memphis, que era uma versão de teste de atualização do sistema, rebatizado pela Microsoft de Windows 9x.

1998:

É desenvolvida a atualização do Windows 95.
Todos os microprocessadores, processadores e co-processadores relacionados foram desenvolvidos pela Intel Corporation, salvo menção contrária.

Principais Características do Processador

Algumas características são essenciais para determinar a performance de um processador.

Podemos destacar:

A freqüência do relógio (clock): estabelece o sincronismo para a comunicação entre os elementos do hardware (memória, processador, periféricos). Quanto maior for o clock, mais operações poderão ser executada no mesmo tempo. Convém salientar que por questão econômicas e técnicas (interferências) as placas periféricas geralmente possuem freqüências menores do que a do processador. A evolução no processo de fabricação do chip com a diminuição de sua potência permite, que o clock cresça cada dia mais. A limitação é o aquecimento do processador que causa erros nas operações;
O barramento interno e externo: os processadores tem evoluído em relação ao comprimento do código que pode ser trabalhado em uma única operação. Os primeiros processadores permitiam trabalhar com palavras de 8 bits, depois vieram os processadores de 16, 32 e atualmente estes trabalham com códigos de 64 bits. Outro detalhe importante é que a rápida evolução dos processadores não é acompanhada por muitas placas periféricas por questões econômicas e para permitir, também, a compatibilidade dos novos equipamentos com equipamentos antigos o processador permite a comunicação com estas placas através de um barramento de “menor capacidade”, ou seja, é possível mesmo para um processador 64 bits, trocar informações com placas de 8, 16 ou 32bits;
O conjunto de instruções do processador: Um processador pode realizar todas as operações com um número bem pequeno de instruções. Como os primeiros processadores eram de 8/16 bits, as instruções manipulavam então 8 e 16 bits. Para garantir a compatibilidade com o processador anterior a cada novo processador são mantidas as anteriores e introduzidas novas instruções para garantir um aproveitamento maior do seu novo potencial. Isto torna a execução dos programas mais rápidos quando os tradutores e compiladores forem converter o código fonte para o código de máquina, por gerar um código de máquina menor e mais eficiente. Abaixo podemos ver uma tabela que mostra o número de instruções desde o 8088 (usado no PC-XT até o MMX).

Microprocessador	Instruções Básicas	Diferença
8088	115	—-
286	142	27
386	200	58
486	206	6
Pentium	216	10
MMX	263	57

O cache de memória

Existem vários tipos construtivos de memórias: há memórias mais rápida e memórias mais lentas. As rápidas possuem custo muito elevado e por esse motivo o banco de memória RAM de um computador geralmente é constituído por chips de memórias mais lentos pois são necessários vários MB para rodarem os aplicativos. Quando o processador solicita o conteúdo de uma posição de memória precisa esperar vários ciclos do relógio até que a informação esteja disponível para o operação necessária.

Devido a organização dos programas, o processador geralmente acessa repetidas vezes durante o processamento as mesmas posição da memória ou a posições próximas desta. Criou-se então o cache de memória, um banco de memória pequena porém rápida que armazena o conteúdo das ultimas posições de memória solicitadas pelo processador. Assim o processador primeiro consulta o cache e se o conteúdo da posição necessária estiver já estiver no cache, não será necessário esperar que ele seja transferido da memória. Os primeiros processadores a terem cache possuíam-no externo.

Depois começaram a possuir um cache bem pequeno muito rápido, chamado de nível um (L1), utilizado para armazenar instruções e dados da execução dinâmica* do processador e um segundo mais lento (porém de acesso muito mais rápido que o da memória), chamado cache de nível dois (L2), que armazena dados gerais da memória.

4004

Em 15 de novembro de 1971 nascia o processador 4004 de apenas 4 bits e grande capacidade para realizar operações aritméticas. Esse micro – processador possuía 2.300 transistores para processar 0,06 milhões de instruções (60.000) por segundo e não tinha o tamanho de um selo de carta. Para se ter uma idéia, o ENIAC, primeiro computador de que se tem notícia , construído em 1946 para fins bélicos, ocupava sozinho 1.000 metros quadrados e fazia o mesmo que o 4004.

O 4004 foi usado apenas para cálculos poucos complexos (4 operações), ele era um pouco mais lento que Eniac II mais tinha a vantagem de possuir a metade do tamanho, esquentar menos e consumir menos energia.

8008

Surgiu em 1972 o 8008, primeiro processador de 8 bits, com capacidade de memória de 16 Kbytes (16.000 bytes), enquanto o 4004 possuía apenas 640 bytes.

8080

Em 1974 é lançado o 8080, com desempenho seis vezes maior que o anterior com um clock de 2MHz, rodava um programa da Microsoft chamado Basic, possuía apenas led’s. Além de 16Kb de memória Rom onde ficava o sistema, possuía 4Kb de memória Ram, seus controles eram através de botões, possuía drive de disquete 8″ com capacidade de 250 Kb.

8086

O primeiro processador feito pela Intel para ser usado com os PC’s. Ele contava com um barramento de dados interno e externo de 16 bits. E foi este o motivo de não ter sido o processador mais utilizado. Inicialmente ele foi distribuído em versões de 4,77MHZ. Posteriormente vieram versões turbinadas de 8 e 10 MHZ.

A história do 8086 é bem simples. Quando ele foi lançado, a maioria dos dispositivos e circuitos disponíveis eram de 8 bits. Era muito caro adaptar todo o resto do computador por causa do processador. E foi isso que acabou com o 8086. Para adaptar-se a este mercado a Intel lançou o 8088, com barramento externo mais lento, de 8 bits. Deixando a diferença de barramento externo, ambos eram idênticos.

Quando este chip, o 8086, veio a ser utilizado já era tarde demais. Ele chegou até a fazer parte de uns poucos clones do IBM PC e posteriormente em dois modelos do IBM PS/2 e de um computador Compaq. Mas sua destruição veio com um processador mais poderoso, o 80286.

Outro possível fator para a pouca aceitação deste processador pode ter sido a falta de unidades devido à demanda. Nunca havia chips suficientes para produzir computadores em grande escala.

286

Este é o único exemplar da segunda geração de processadores. O 286 chegou para tomar de assalto o lugar dos processadores de primeira geração.

A IBM lançou o 286 inicialmente no seu IBM PC-AT (advanced tecnology, ou tecnologia avançada). Depois vieram os clones. Deste, os mais famosos foram os Compaq. A Compaq usou o 286 em 6 micros e a IBM em 5, sendo 4 destes modelos PS/2.

O abismo entre o 286 e seus antecessores é enorme. Basicamente foram três diferenças importantes. A primeira foi a capacidade de utilizar até 16 Mb de memória, dezesseis vezes mais que os da geração anterior.

A segunda foi a criação da memória virtual. Com este recurso o processador poderia utilizar outras fontes de memória externas para simular memória interna.

Assim, além dos 16 Mb de memória real que o 286 podia manipular, era possível simular mais 1 bilhão de bytes.

A terceira melhoria foi a multitarefa de hardware. Não significa que o processador era capaz de executar multitarefa real (preemptiva), como conhecemos hoje.

Esta é a multitarefa cooperativa, onde o processador executa os programas em intervalos, pulando de um para o outro numa velocidade tão alta que os programas parecem estar rodando simultaneamente.

Ainda existia uma outra característica. Enquanto os processadores anteriores executavam sempre no modo real, o 286 poderia trabalhar também no modo protegido. No modo real ele agia como os processadores de primeira geração, o que manteve a compatibilidade entre gerações. Já no modo protegido é que ele brilhava. Programas eram executados em porções protegidas da memória, individualmente. Problemas em determinada aplicação não afetariam as outras. Já no modo real, programas mal-comportados poderiam comprometer too o sistema.

Como o sistema operacional mais utilizado era o DOS, para a maioria de nada adiantou o 286 ter esta capacidade. O DOS ainda era baseado no 8086 e, logo, era limitado aos recursos deste processador, mesmo tendo o 286 à sua frente. Sistemas operacionais de verdade utilizaram estas capacidades especiais do 286. Foram o OS/2 e alguns tipos de UNIX (Xenix e AIX). Aqui se percebe como começou a saga dos GPF do Windows. No fundo, até o Windows 95 tem um pedaço do DOS 1 dentro dele.

O 286 tem um erro de projeto, ele pode chavear do modo real para o protegido mas não pode voltar para o modo real, somente reinicializando a máquina, ele era 6X mais rápido que seu antecessor o 8088.

386

A terceira geração de processadores Intel foi outra senhora evolução de performance em relação a segunda geração. Até aqui a Lei de Murphy, talvez o cara mais otimista que já vi na minha vida, está totalmente correta.

Relembrando os mais desmemoriados, Murphy praticamente profetizou que a cada 18 meses a performance dos processadores duplicaria. Até aqui ele está correto, o que não ocorre nos dias atuais.

Foi por volta desta geração que se começou a apelidar os processadores carinhosamente como os “oitões”. O 386 era e ainda e conhecido pelos mais próximos como o “três-oitão”.

Foi a primeira versão do “três-oitão”. Também foi o primeiro processador totalmente de 32 bits, ou seja, ele operava tanto internamente quanto externamente a 32 bits. Este processador continuou a ter uma modalidade real para manter compatibilidade com os processadores anteriores. Mas o modo protegido era mais evoluído que o do 286. Foi a partir do 386 que se formou o conjunto de instruções padrão x86. Desde então, mínimas mudanças ocorreram no x86.

As capacidades de memória também cresceram. Era possível manipular, teoricamente, 4 Gb de memória real e 64 trilhões de bytes de memória virtual. Aliada a capacidade de processar 32 bits de uma vez só, o 386 se tornou capaz de executar programas muito mais complexos. Dando um exemplo no mundo dos games, Doom foi o primeiro jogo que eu tenho notícia a ser 100 % 32 bits, e por isso é que ele tinha toda aquela complexidade.

Não acabou por aqui, não! A Intel adicionou um novo modo de operação, o modo 86 virtual. Foi a partir daqui que começaram a aparecer os sistemas operacionais multitarefa, como o OS/2. O Windows 386 também usou esta habilidade para poder executar vários programas DOS em separado, protegidos um da capacidade destrutiva do outro. Os sistemas operacionais gráficos só se tornaram possíveis com este novo recurso do 386.

O 386 da Intel só ficou no 33 MHZ. Foi preciso que alguns clones aparecessem para que ele fosse mais longe. Os clones da AMD e da Cyrix atingiram um máximo de 40 MHZ. O motivo da Intel ter se limitado a esta velocidade parece ser receio de que um 386 fosse mais potente que um 486.

De fato, um bom 386 de MHZ poderia ser comparado a um 486 dos mais simples. Os primeiros 386DX lançados tinham um bug na instrução de multiplicação 32 bits do modo protegido.

Os Primeiros 386 operavam a 12,5Mhz, mas logos foram substituídos pelos DX, 16, 20, 25, 33, 40 e 50 Mhz, a Intel também lançou uma versão para notebooks que era 386SL. Como os processadores Intel anteriores, o 386 também continha um co-processador matemático denominado 387.

486

Em Abril de 1989, a Intel lançou o processador 486 no mercado e apresentava poucas inovações em relação ao 386, seu núcleo possuía 0,8µm, uma grande novidade foi a implantação de uma algumas técnicas RISC. Outra novidade foi a multiplicação de clock’s internos, pois os processadores evoluem e permitem taxas de Mhz maiores que as placas mães um exemplo é o 486DX2, ele funciona com o clock multiplicado por 2, ou seja, a placa mãe (Bus Externo) trabalha a 33Mhz e o processador a 66Mhz.

O processador seguinte foi o 80486, um melhoramento da 80386. Foram adicionadas algumas instruções e o versão original 80486 DX possuiu coprocessador matemático interno e um pequeno L1 cache. A tecnologia foi tão avançada que Intel lançou processadores com clock interno duplicado (80486 DX2) e triplicado (80486 DX4) e chegou a 100 MHz. O 80486 também possuiu a versão OverDrive (Um processador em cima do outro). Nesta época começaram a sair sistemas operacionais para PC de 32 bits.

Clock simples

487 => Co-processador matemático usado na versão 486SX.
486SL => Versão para notebook, mas não alcançou sucesso desejado, e a Intel parou de fabricá-lo
486SX => Versão de custo mais baixo ou básica, com ausência de co- processador matemático, 25 e 33 Mhz
486DX => Versão completa, com pequena quantidade de cache L1, 25 e 33 Mhz.

Clock duplicado

487SX => Para quem quisesse por um co-processador matemático nas versões 486SX2. Ele era encaixado em um slot próprio na placa mãe. 486SX2 => Versão de custo mais baixo ou básica, com ausência de co- processador matemático, 50 e 66 Mhz
486DX2 => Versão completa, igual o DX mas a clock’s de 50 e 66Mhz.

Clock triplicado

486DX4 => Top de linha, 75 e 100 Mhz, aceita cache L1 e L2.

Pentium Clássico

O processador Pentium possuía 64 bits de barramento. A Intel registrou a marca Pentium para ter um nome próprio para novo e poderoso processador.

Ele tinha vários clock’s internos diferentes e chegou a 200 MHz. Na verdade um processador Pentium (primeiros) são dois processadores 80486 num com um algoritmo de processamento paralelo. Possui 3,1 milhões de transistores 3X (vezes) a mais que o 486, cache interno de 16Kb (8KB para extração de instruções e 8KB para dados). Os primeiros Pentium tem clock de 60 e 66 Mhz, apos ter incrementado largura do barramento local para 64 bits ele pode atingir clock’s mais elevados. Possui no processador algumas instruções RISC, sendo o primeiro a implementa uma unidade de execução superescalar, significa que sob certas condições podia executar 2 instruções por ciclo de clock.

O co-processador matemático foi totalmente redesenhado, agora ele aceita um nível de desempenho de 3 a 10 vezes a do 486, possuía um auto-teste automático incorporado verificando todos os conectores com placa mãe, cache e registradores. O núcleo do Pentium pode variar de 0,6µm a 0,4µm. Clock’s 60, 66, 75, 90, 100, 120, 133, 150, 166 e 200.

Pentium MMX

Com a tecnologia MMX, PC’s entrarão em um novo nível de performance de multimídia. Ganha-se em som vívido, ricas cores, rendimento 3D realístico, animação suave e vídeo.

Os tipos de aplicativos que irão se beneficiar do desempenho oferecido pela tecnologia MMX, ao longo do tempo, incluem: escaneamento e manipulação de imagens, videoconferências, plug-ins e browser’s para Internet, editoração e play-back de vídeo, impressão, fax, compressão, decodificação e programas para escritórios.

Existe a expectativa que de que nos próximos anos periféricos como placas de vídeo, som e modem percam sua finalidade, tendo em vista que as funções que elas executam serão emuladas vias software.

Principais características incorporadas no MMX:

Novas Instruções

Se observarmos o número de instruções dos processadores, observaremos que em dois momentos ouve um aumento significativo destas. A primeira vez em 1985 no lançamento dos chips 386 que viabilizaram o conceito de multitarefa e a interface Windows para os PC’s e agora com o MMX em que foram adicionado 57 novas e poderosas instruções especificamente desenhadas para manipular e processar dados de vídeo, de áudio e gráficos eficientemente. Essas instruções são orientadas s seqüências altamente repetitivas e paralelas geralmente existentes nas operações de multimídia.

Estas instruções são capazes de manipular dados agrupados em pacotes de 64 bits enquanto que a instruções existentes até então manipulavam dados de 8 ou 16bits. Estas instruções usam um processo chamado Instrução Única de Múltiplos Dados (SIMD) permite que uma instrução execute a mesma função em múltiplas partes dos dados, ou seja, ela permite que uma operação em vez de ser executada em um único bloco possa ser executada ao mesmo tempo em vários blocos de 8 e 16 bits (8 bits para imagem e 16 bits para som).

Assim será reduzido o número de voltas intensivas de computação comuns com vídeo, áudio, gráficos e animação, tornando o processamento muito mais rápido. Usa novo padrão de conexão com a placa mãe denominado Socket7. Opera a voltagens de 2,8V.

Mais Cache

Foi dobrado o tamanho do cache L1 no chip para 32K Assim, mais instruções e dados podem ser armazenados no número de vezes que o processador tem para acessar áreas lentas para obter informação.Nova tecnologia de 0.35µm, clock’s 166, 200, 233 Mhz.

Pentium Pró

Principais Características:

Freqüência de 150 MHZ, 166, 180 MHZ e 200 MHZ
Otimizado para aplicações em 32-bit rodando em sistemas avançados de 32-bit
Microarquitetura de execução dinâmica
Pacote contendo processador, cache e interface para o sistema de barramento
Escalável para até 4 processadores e 4 GB de memória
Cache L1 de 8K/8K separado entre dados e instruções; possui separação entre o barramento se sistema externo e o barramento de cache de alta velocidade interno
Cache L2 interno: possui cache de nível 2 interno, podendo trabalhar na mesma velocidade do processador. Para de obter o mesmo desempenho de 256KB interno, para um processador de mesma potência, seria necessário 2MB de cache externo.
Arquitetura Dual Independent Bus: O barramento interno é dividido em dois barramentos um para o cache L2 e o outro do sistema do processador para a memória principal. Esta arquitetura de barramento resolve o problema de limitação da largura de banda do barramento, oferecendo largura de banda de desempenho até três vezes superior à dos processadores de barramento único como o existente no processador Pentium. Isto significa um desempenho mais rápido do sistema como um todo.

Execução dinâmica: é uma técnica que usa a combinação de 3 processos para aumentar a velocidade de execução do software:

O processador monitora passos a frente no software (20 a 30 instruções a frente do contador de programa) antecipando-os.
O processador analisa quais instruções são dependentes de cada resultado, criando uma lista otimizada dessas instruções;
Baseada nesta lista, instruções são carregadas especulativamente.

Isto tudo permite que ele consiga realizar três instruções em um único ciclo de clock (Pentium permitia 2 instruções), agilizando o trabalho em sistemas que utilizam processamento paralelo.

Como o chip Pentium Pro possui capacidade de processamento até duas vezes superior ao do Pentium, máquinas equipadas com este processador podem substituir as que se baseiam no modelo Dual – Pentium, obtendo o mesmo resultado em uma plataforma mais simples, por conseqüência mais econômica e mais fácil de usar. Isto é uma grande vantagem, considerando que muitos softwares, não empregam de maneira eficiente a tecnologia de multiprocessamento simétrico (SMP). O Pentium Pro e o Pentium II possuem um Bug que será mencionado posteriormente.

Pentium com tecnologia OverDrive

Alguns Processadores Pentium 166 e 200Mhz aceitam que seja acoplado em cima um processador de expansão chamado OverDrive possibilitando a atualização dos mesmos. Exemplo um Pentium 166, com OverDrive para 233Mhz vai operar nessa freqüência com MMX, mas esse sistema não funcionou como deveria pois alem do processador OverDrive sair quase o mesmo preço de um processador novo, todo esse sistema esquentava e diminuía seu desempenho.

Pentium II

No dia 7 de maio de 1997 a Intel Corporation lançou o processador Pentium II com 7,5 milhões de transistores, que com o objetivo de para possibilitar novos níveis de desempenho e recursos de computação visual aos usuários de desktop e estações de trabalho nas empresas. O processador Pentium II, lançado nas velocidades de 300, 266 e 233 MHz, combina as avançadas tecnologias do Processador Pentium Pro com os recursos da tecnologia de aperfeiçoamento de meios eletrônicos MMX. Esta associação confere aos usuários de empresas maior poder para direcionar a computação empresarial, oferece recursos sofisticados para pequenas empresas e incorpora o processador Intel de velocidade superior s estações de trabalho.

A expectativa é que o PC transformará rotineiramente todos os tipos de dados brutos em detalhados modelos em 3D em uma questão de segundos, contribuindo assim para que os usuários assimilem melhor as informações de que dispõem e que as transações interativas de empresas combinarão vídeo, áudio e recursos gráficos realistas para informar ou demonstrar novos produtos ou serviços a clientes potenciais.

Os Clock’s dos processadores Pentium II variam de 233 a 400 Mhz, sua freqüência de barramento externo pode chegar a 66Mhz ou seja 528Mg/s, seu encapsulamento é o SECC1 (forma de cartucho) ele é conectado somente em Slot1, núcleo de 0.25 µm.

O co-processador matemático integrado deste processador possui um bug na instrução de conversão de números de ponto flutuante (números reais, com precisão de 80 bits) para números inteiros (que possuem precisão somente de 16 ou 32 bits).

As chances do bug ocorrer: 1 em 8,6 bilhões na conversão de um número de ponto flutuante para inteiro de 16 bits ou 1 em 563 trilhões na conversão de um número de ponto flutuante para inteiro de 32 bits. Este bug está sendo chamado de “Dan0411”, por ter sido descoberto por um certo “Dan” em 11 de abril de 1997 (04-11, no formato americano).

Avanços tecnológicos

O processador Pentium II combina avanços tecnológicos de grande capacidade para melhorar o desempenho no ponto flutuante, em multimídia e em integração.

São eles:

Inovadora arquitetura Dual Independent Bus, implementada pela primeira vez no processador Pentium Pro e que resolve o problema de limitação de largura de banda existente nas arquiteturas dos processadores da geração anterior.

Tecnologia MMX, acrescentada ao processador Pentium II para melhorar o desempenho dos aplicativos de áudio, vídeo e gráficos, bem como aumentar a velocidade de decodificação e compressão de dados.

Pentium III

O clock do Pentium III varia hoje de 500 Mhz a 933 Mhz, sua freqüência de barramento externo pode chegar a 133Mhz, ou seja, 1,06 GB/s, pode acessar até 4GB de memória usando cache, Possui um número de série gravado em uma ROM dentro do processador, onde fornece o número do processador, configurações de clock e voltagem, ela é chamada de PIROM (Pentium Information Rom) com ela é quase impossível overclock e falsificação. O primeiro Pentium III a ser lançado era no formato de um cartucho (SECC2) onde era encaixado em um slot chamado Slot1, o mesmo do Pentium II.

O processador Pentium III integra a micro-arquitetura Execução Dinâmica P6, a Arquitetura para Barramento Dual Independente (DIB), um barramento com sistema multi-transação e a tecnologia para otimização de mídia Intel® MMX™ . Além disso, o processador Intel Pentium III oferece extensões de Internet Streaming SIMD, 70 novas instruções possibilitando um avanço significativo em imagens, 3D, streaming de áudio e vídeo e reconhecimento de voz para uma melhor experiência na Internet.

Os novos modelos de Pentium III, chamado FCPGA (Flip Chip Pin Grid Array) ou Coppermine (seu nome-código), que, em vez de usar um cartucho como os modelos tradicionais de Pentium II e Pentium III, usa pinagem soquete 370, a mesma do processador Celeron. Teoricamente toda placa-mãe soquete 370 aceita esse novo modelo de processador, mas não é isso o que ocorre na prática. A maioria das placas-mãe soquete 370 fabricadas antes do lançamento desse processador não aceitam a sua instalação, por motivos de compatibilidade que não são resolvidos com um simples upgrade de BIOS.

Portanto, ao comprar uma placa-mãe para o Pentium III FCPGA certifique-se de que a placa-mãe aceita corretamente esse processador.

Mas não é só na pinagem que o Pentium III FCPGA é diferente. Internamente ele possui somente 256 KB de memória cache L2, a metade da quantidade de memória cache existente no Pentium II e Pentium III convencional. Em compensação, o cache do Pentium III FCPGA é acessada na mesma freqüência de operação do processador, enquanto nos modelos de cartucho esse circuito é acessado na metade da freqüência de operação. Isto é, no Pentium III-550 FCPGA o cache é acessado a 550 MHz, enquanto que no Pentium III-550 em cartucho esse circuito é acessado a somente 275 MHz. No final das contas, apesar de ter menos memória cache, esse novo processador acaba sendo mais rápido.

Após a VIA Technologies surpreender a todos na CeBIT 2001 com o menor processador do mundo para PC’s, graças a sua tecnologia de produção com transistores de 0,15 mícron, a Intel acaba de anunciar que a sua nova fábrica em Oregon (EUA) começou a produzir os seus primeiros processadores com transistores de 0,13 mícron. O novo Pentium III fabricado com transistores de 0,13 mícron será conhecido como Pentium III Tualatin. Segundo a Intel, como este processador é alimentado com somente 1,2 volts, será necessário que ele utilize um novo soquete, o soquete FC-PGA 2. Placas-mãe com o soquete FC- PGA 2 são totalmente compatíveis com os processadores atuais, de soquete FC-PGA e PPGA, já as placas-mãe atuais de soquete FC-PGA, não poderão utilizar os processadores Pentium III Tualatin. Provavelmente as placas-mãe de Slot 1 poderão utilizar este processador através de um adaptador de soquete FC-PGA 2 para Slot 1. Outra diferença do Pentium III Tualatin será com relação ao seu formato, ele será fabricado com placas de silício de 300 milímetros, 100 milímetros a mais do que os processadores atuais utilizam. De acordo com a Intel, com o aumento das placas de silício, será possível reduzir o preço deste processador em 30 %. Também será incluído em seu encapsulamento um pequeno dissipador, de forma parecida com o que é utilizado nos processadores K6-2 e K6-3. Por enquanto este processador está sendo fabricado somente como teste, mas no máximo até Julho a Intel deve começar a produzi-lo em alta escala com uma freqüência inicial de 1,13 GHz. O Pentium 4 provavelmente ainda este ano também será produzido com transistores de 0,13 mícron.

PII Xeon

Verdadeiro Pentium Pró MMX, possui cache L2 trabalhando na mesma freqüência do processador é conectado somente em Slot2, também chamado de Slot de 330 contatos. ( Aparentemente igual ao Slot1 ) encapsulamento SECC2. Aceita 512, 1 e 2 MG de memória cache acessados no clock do processador. Aceita até 64GB de Ram. Opera externamente a 100 MHz, aumentando diretamente o desempenho do micro não só para processamento, mas também para vídeo e disco. Os clock’s do PII Xeon são de 400 e 450 MHz.

Ele tem a capacidade de multiprocessamento simétrico, isto é, a utilização de mais de um processador em uma mesma placa-mãe é maior. Enquanto o Pentium II e o Pentium III permitem multiprocessamento direto com até 2 processadores, o Pentium II Xeon e o Pentium III Xeon permitem multiprocessamento com até 4 processadores (ou 8 processadores, no caso do modelo com 2 MB de cache L2). Como você pode perceber pelas suas características, essa família de processadores é destinada a servidores de rede, ela possui um desempenho altíssimo, mas é muito cara, ficando praticamente restrita ao mercado corporativo.

PIII Xeon

Tem as mesmas características do PII Xeon mais MMX2 e SIMD. Possui duas versões uma com núcleo de 0,25µm que opera externamente a 100Mhz e outra com 0,18µm a 133 Mhz.Os clocks do PIII Xeon são de 600, 667, 733, 800, 866, 933 MHz, e 1Ghz.

Celeron

História da Intel

É um Pentium II sem memória cache L2 integrado, mas lançaram o Celeron-A que tem 32Kb de cache L1 (16K para infraestrutura e 16K pra informação,data) e 128Kb de L2 aumentando seu desempenho, ele é conectado em Slot 1 ou em PGA, ele é atualmente a linha econômica da Intel para concorrer com o Duron da AMD. Trabalha com, Bus externo de 66Mhz a 100Mhz, núcleo do processador é de 0,18µm.

Pentium 4

O Pentium 4 é um processador Intel de sexta geração, assim como ocorre com o Pentium Pro, Pentium II, Pentium III e Celeron. Em outras palavras, apesar de usar um novo nome, esse processador usa a mesma estrutura interna de seu antecessor, Pentium III.

Com algumas modificações para torná- lo mais rápido, é claro.

Entre as novidades da arquitetura interna desse processador estão:

A sua Unidade Lógica Aritmética (ULA ou ALU) trabalha com o dobro do clock interno do processador, aumentando o desempenho em cálculos usando números inteiros. Por exemplo, em um hipotético Pentium 4 de 800 MHz, a sua ULA trabalhará a 1,6 GHz.

Tecnologia SSE-2, contendo 144 novas instruções em relação à tecnologia SSE (“MMX2”) que é usada pelo Pentium III. A novidade é o uso de registradores de 128 bits, permitindo a manipulação de mais dados pequenos por vez (16 dados de 8 bits por vez, por exemplo).

Barramento de dados externo de 128 bits, isto é, o Pentium 4 conversará com a memória RAM usando 128 bits por vez. Esse processador continua sendo um processador de 32 bits, pois utiliza a mesma arquitetura básica do 386 (instruções x86 ou IA-32). A nomenclatura “processador de 32 bits” ou “processador de 64 bits” normalmente refere-se ao software que o processador poderá executar. Esse processador continua usando o mesmo software existente hoje (Windows 9x, Windows 2000, etc), que é um software de 32 bits. A tecnologia hyper-pipelined dobra a capacidade de profundidade de encadeamento para 20 estágios, aumentando bastante o desempenho do processador e capacidade de freqüência.

Barramento externo operando a uma taxa de 3,2 GB/s. Você verá escrito em muitos lugares que o barramento externo desse processador será de 400 MHz. Mas isso não é verdade. Como o barramento externo dobrou de tamanho, passando de 64 bits para 128 bits, a taxa de transferência também dobrou.

Por exemplo, em um Pentium III, sua taxa de transferência externa é de 800 MB/s, por operar externamente a 100 MHz a 64 bits por vez. Passando esse barramento para 128 bits, teremos uma taxa de 1,6 GB/s. Logo, muito possivelmente o barramento externo do Pentium 4 será de 200 MHz.

Cache L2 integrado trabalhando na mesma freqüência interna do processador, assim como ocorre no Celeron e nos últimos modelos de Pentium III. Disponível em 1.30, 1.40 e 1.50 GHz

Itanium

Possui tecnologia RISC e não CISC como nos processadores anteriores, usado principalmente em workstation, (em grandes empresas) opera com: Unix, Linux e Windows NT, seu preço é bastante salgado.

Características

Explicitly Parallel Instruction Computing (EPIC), possibilita que o processador trabalhe com 20 operações simultaneamente.

Possui melhor performance para trabalhar com dados criptografados incluindo SSL e IPSec informação.

Endereça número ilimitado de memória, possui um sistema de detecção e correção de erros. Cache L1 e L2 dentro do processador e a possibilidade de um cache L3 de 2Mg a 4Mg operando a 800Mhz.

A Advance Micro Device (AMD) é o principal e mais antigo concorrente da Intel. Esta empresa produzia processadores 286 sob licença da Intel, e posteriormente reivindicou a extensão da licença para os 386 e 486. Até agora ela foi bem sucedida, mantendo essa posição. Nos mercados do 286, 386DX e 386SX, eles ofereciam dispositivos compatíveis em termos funcionais e pinagem a taxas mais altas de clock’s, com menor dissipação de energia SMM aprimoradas. A AMD não encontrou o mesmo sucesso nos mercados do 486, seus dispositivos 486 eram atrasados para o mercado, e não ofereciam vantagem funcional ou de desempenho concreta sobre os dispositivos da Intel.

A estratégia da AMD para os produtos 486 era competir em preço oferecendo versões de velocidade de clock não aceitas pela Intel. Antecipando-se a uma regulamentação adversa relativa ao seu status de licenciada ,a AMD tinha dois design’s de 486, um baseado na tecnologia Intel e outro no seu próprio design (Nx586). Em uma tentativa de ganhar uma posição de liderança a AMD lançou o K5, mas acabou se dando mau, o processador tinha problema de aquecimento e não atendeu aos resultados esperados, logo após foi a vez do K6 e tinha o mesmo problema do K5, com esse processadores a AMD ficou com má reputação, mas é errando que se aprende, a AMD deu seu primeiro passo positivo com o K6II assim se tornando um potencial problema para a Intel. A disputa acirrada das duas somente nós usuários temos a ganhar com preço e desempenho, a AMD se firmou de vez com o lançamento do Athon onde pela primeira vez a imponente Intel foi superada em termos de desempenho.

586

Em termos de funcionamento é igual ao 486DX4 mudando apenas com duplicação do clock, acréscimo de algumas instruções RISC (bem poucas),execução superescalar, pinagem Socket3, simplesmente um 486DX4 turbinado, 486 Dx5, esse processador tem problema de super aquecimento, e foi através dele que Intel “brigou” com a AMD.

K5

Primeiro processador CISC verdadeiramente não Intel a AMD afirmou que ele iria superar o desempenho do Pentium a velocidades semelhantes de clock, essa vantagem se deva a um design superescalar superior. Os pipelines duplos do K5 possuem menos restrições para a execução de instruções simultâneas, e não só aceitam previsão de desvio como também realizam uma execução especulativa. Possui um cache de pré-decodificação de 16Kb e outro de dados 8Kb, colocadas instruções RISC, usava Socket5 para conexão com a placa mãe.

K6

Características Internas

Cache L1 de 64 KB, dividido em dois de 32 KB, um para dados e outro para instruções Núcleo RISC com decodificador CISC, similarmente ao K5 (5K86), ao 6×86 (M1), M2 e Pentium Pro. Decodificador funciona bem tanto para código de 16 bits quanto para código de 32 bits (diferentemente do Pentium Pro onde o decodificador não funciona bem para código de 16 bits). O decodificador CISC/RISC consegue decodificar até 2 instruções por pulso de clock, dependendo da complexidade da mesma. Ou seja, consegue decodificar até 2 instruções simples por pulso de clock. Vale lembrar que programas utilizam instruções simples 80% das vezes. Conjunto de Instruções MMX (segundo a AMD, compatível com o MMX da Intel). O Co-processador integrado do K6 não é tão bom quanto o do Pentium Pro ou quanto do Pentium II. Devemos ter isto em mente ao decidirmos pelo K6.

Demais características internas similares ao Pentium Pro: execução fora de ordem, execução especulativa, previsão de desvio, etc.

Em tempo: a previsão de desvio do K6 é bem melhor que a do Pentium Pro.

Características Externas:

Compatível com socket7, ou seja, utiliza a mesma placa-mãe do Pentium. Alimentação a 2,9 V, com exceção do modelo K6-233 que deve ser alimentado com 3,2 V. A tendência é que os próximos processadores K6 utilizem 2,8 V ou menos. Possuem um grave problema de aquecimento, que em certos casos o processador era queimado, seu preço não era competitivo.

K6-2

Sua grande diferença para os demais processadores testados é a sua freqüência de operação externa. Enquanto todos os outros processadores testados operam externamente a 66 MHz, o K6-2 opera a 100 MHz, conseguindo uma taxa de transferência mais elevada com a memória RAM, com o cache de memória e com outros dispositivos do micros, especialmente o vídeo e o disco. Seu padrão de pinagem é Socket7, o mesmo padrão do Pentium, Pentium MMX e MII. Entretanto, por trabalhar externamente a 100 MHz, necessita de uma placa-mãe Socket7 que consiga trabalhar a essa freqüência de operação. Esse tipo de placa-mãe é conhecido como “Super7”.

O K6-2 da AMD foi uma revelação: o K6-2 300Mhz testado obteve um desempenho de processamento 5% superior ao do Pentium II 300Mhz e 70% superior ao Pentium MMX 233Mhz. O MII-PR300 da Cyrix, apesar de ter obtido um desempenho 36,5% inferior ao do K6-2 300Mhz e 33,24% inferior ao do Pentium II 300Mhz, é 8% mais rápido que o Pentium MMX-233. É válido lembrar que o MII-PR300 trabalha internamente a 233 MHz.

Resumo das principais características:

Microarquitetura superescalar de seis instruções RISC avançada.
Dez unidades de execução paralelas especializadas.
Sofisticados decodificadores de instrução x86 para RISC86 múltiplos.
Avançado sistema de branch prediction de dois níveis.
Execução especulativa.
Execução fora de ordem completa.
Renomeação de registros e retransmissão de dados.
Até seis instruções RISC86 por ciclo.
Caches L1 no chip.
Cache de instrução de 32 Kbyte com 20 Kbytes adicionais de cache para predecodificação.
Cache de dados de duas portas com “writeback” de 32 Kbytes.
Protocolo MESI para coerência de cache.
Tecnologia 3DNow!
21 novas instruções para melhorar o desempenho de gráficos 3D e multimídia.
Multiplicador separado e ALU para execução de instruções superescalares.
Compatível com infra-estrutura Super7 e Socket 7 para projetos de baixo custo e disponibilização mais rápida ao mercado.
Compatível tanto com barramento de 100 MHz como de 66 MHz.
Suporte a Accelerated Graphics Port (AGP, Porta Gráfica Acelerada).
Avançada execução de instruções MMX superescalares com decodificação e pipelines de execução duplos.
Unidade de ponto flutuante (FPU) compatível com IEEE 754 e 854 de alto desempenho.
Modo de gerenciamento de sistema (SMM) de padrão industrial.
Compatibilidade de software binário x86 completa.
Tamanho da pastilha: 9,3 milhões de transistores em uma pastilha de 81 mm2.
Disponível em encapsulamento CPGA (Ceramic Pin Grid Array) de 321 pinos (compatível com Super7/Socket 7) usando a tecnologia inovadora “flip-chip” C4.
Fabricado usando a tecnologia estado da arte da AMD em 0,25 µm, com processo de deposição de metal em silício de cinco camadas e a tecnologia de interconexão local nas instalações de fabricação de wafers da AMD.
Clock’s de 300, 333, 350, 400, 450, 500, 533, 550 Mhz.

Processadores K6-2E

Processadores de baixo consumo de potência, de 333 MHz e de 300 MHz. Os processadores embutidos AMD K6-2E foram projetados para oferecer alto desempenho a baixo custo, para serem usados principalmente em notebooks.

A versão de baixa potência do processador AMD K6-2E funciona com uma menor tensão de núcleo, de 1,9 V, para fornecer um consumo máximo inferior a 10 watts e uma faixa de temperatura estendida de 85°C, enquanto a versão de potência padrão é o equivalente embutido do popular processador AMD K6- 2 desktop com uma tensão de núcleo padrão de 2,2 V e faixa de temperatura padrão. Nas duas versões, a tensão de E/S opera no nível de 3,3 V que é o padrão do mercado.

Projetado para executar tanto software de 16 bits quanto de 32 bits, os processadores AMD K6-2E fornecem processamento de alto desempenho do conjunto de instruções x86 e são compatíveis com os sistemas operacionais Microsoft Windows CE, Windows 98, Windows ME e Windows NT, e também com os aplicativos executados neles, incluindo os mais recentes softwares otimizados para tecnologias 3DNow! e MMX.

O processador AMD K6-2E de 9,3 milhões de transistores é fabricado com a tecnologia de processamento de metal de cinco camadas de 0,25 mícron, usando interconexão local e isolamento tipo ” shallow-trench” nas instalações de fabricação de chips Fab 25 da AMD em Austin, no Texas. O processador AMD K6-2E é embalado num pacote CPGA (ceramic pin grid array) de 321 pinos compatível com as plataformas Socket 7 e Super7 usando a tecnologia de interconexão flip-chip C4.

Parece que a AMD acertou em cheio com o seu K6-2, tanto em desempenho quanto em preço. Competindo no mesmo mercado que o Pentium II, o K6-2 é mais rápido e barato que o concorrente da Intel. Entretanto, o Pentium II-350 e superiores, onde o processador passa a trabalhar externamente a 100 MHz a exemplo do que ocorre no K6-2, tendem a abalar um pouco o aumento de mercado que a AMD tem conseguido. A Intel só será capaz de frear a AMD se baixar os seus preços, pois os processadores da AMD, o Duron e o Athlon serão processadores extremamente poderosos e, é claro, bem mais baratos que os produtos Intel.

K6-III

O K6-III (nome-código “Sharptooth”) é um K6-III com um cache de memória L2 de 256 KB integrado dentro do processador, a exemplo do que ocorre no Pentium Pro e no Celeron-A. Além disso, esse é o primeiro processador a aceitar um cache de memória L3, ou seja, além dos dois caches de memória dentro do processador, o K6-III ainda permite um terceiro cache de memória na placa-mãe.

Além disso, a grande vantagem do K6-III é utilizar placas-mãe “super 7”, ou seja, placas-mãe que utilizam o mesmo soquete do Pentium (soquete 7), mas com barramento de 100 MHz. Esse é o tipo de placa-mãe atualmente utilizado pelo K6-2. Clock’s de 500, 533 e 550 Mhz.

Duron

Anteriormente conhecido por seu nome-código Spitfire (ou Athlon Select), ele é um processador Athlon destinado a micros baratos, concorrendo diretamente com o Celeron da Intel.

Possui um cache L2 integrado dentro do processador (trabalhando na mesma freqüência de operação interna do processador), mas de apenas 64 KB. Mas é bem provável que mesmo assim o Duron seja muito mais rápido do que o Celeron, já que o cache L1 do Celeron é de apenas 32 KB, enquanto que esse circuito do Duron é de 128 KB. Em outras palavras, apesar de o cache L2 do Duron ser menor que o do Celeron, o cache L1 é maior.

Mas a grande característica que diferencia o Duron de todos os demais processadores existentes hoje no mercado é o uso de um novo padrão de pinagem, chamado soquete A, que é um soquete de 462 pinos parecido com o usado pelo Celeron (que tem 370 pinos e, logo, incompatível). Isso significa que o Duron necessita de placas-mãe que usem esse novo tipo de soquete. Isto é, não dá para fazer upgrade de qualquer outro processador para o Duron trocando-se apenas o processador, mesmo que seu processador atual seja da AMD. Ele é alimentado com 1,5V

Barramento de Alta Velocidade: O processador AMD Duron dispõe de barramento front side de 200 MHz. Este barramento de alta velocidade oferece performance superior em aplicações de uso intensivo de dados, como MP3, decodificação de DVD por software e pacotes de edição de vídeo. Além disso, ele tem espaço para suportar periféricos que exigem grande largura de banda – bem como outras tecnologias emergentes -sem penalizar a performance.

Sofisticada Arquitetura de Cache: A sofisticada arquitetura de cache do processador AMD Duron oferece 192 KB incorporados. Esta maior quantidade de cache incorporado e sua sofisticada arquitetura oferecem performance superior na grande maioria das aplicações. Unidade de Ponto Flutuante (FPU) Superescalar com Tecnologia 3DNow!

Aprimorada: O processador AMD Duron oferece 3 pipelines de ponto flutuante. Esta excepcional capacidade de processamento matemático, aliada à tecnologia 3DNow! aprimorada da AMD, permite ao processador oferecer superior desempenho em aplicações que utilizam multimídia e conteúdo de ponto flutuante.

Athlon

Também chamado de K7 micro-arquitetura de sétima geração e o barramento de sistema de largura de banda grande do processador AMD Athlon permitem que ele alcance níveis de desempenho nunca antes atingidos por um processador x86. O processador AMD Athlon ultrapassa de maneira significativa os processadores x86 de gerações anteriores, incluindo a família de produtos Pentium® III da Intel, e fornece o mais elevado desempenho existente para inteiros, ponto flutuante e multimídia 3D para plataformas x86.

Clock’s 700, 850, 900 e 950 Mhz, 1, 1.1, 1.13, 1.2, 1.3 e 1,33 Ghz
Micro-arquitetura: O processador AMD Athlon possui uma micro- arquitetura superescalar de nove estágios em estrutura super-pipelined otimizada para altas freqüências de clock.
O AMD Athlon contém um total de nove pipelines de execução: três para cálculos de endereços, três para cálculos de números inteiros e três para a execução de instruções x87 (ponto flutuante), 3DNow! e MMX™ .
Barramento do Sistema: O barramento do sistema AMD Athlon é o primeiro barramento de sistema de 200 MHz para plataformas x86, além de ser o mais rápido barramento de processador x86 existente fornecendo o dobro da largura de banda máxima do barramento de 100 MHz usado pelo Pentium III. O barramento de sistema do AMD Athlon é projetado para multiprocessamento escalonável e alavanca a tecnologia de barramento Alpha™ EV6 de alto desempenho da Digital para permitir um desempenho do sistema sem precedentes. Ao contrário do projeto de barramento compartilhado de pouca largura de banda limitada do Pentium III, o barramento de sistema AMD Athlon usa uma arquitetura ponto-a-ponto para fornecer largura de banda superior para plataformas x86 de uniprocessamento e multiprocessamento.
Máquina de Ponto Flutuante: O processador AMD Athlon inclui a primeira máquina de ponto flutuante super-escalar e inteiramente em pipeline para plataformas x86. O recurso de ponto flutuante resultante é o mais poderoso já fornecido em um processador x86, e compete com o desempenho de muitos processadores RISC usados em estações de trabalho e servidores.
Tecnologia 3DNow!™ Otimizada: A tecnologia 3DNow! otimizada do processador AMD Athlon leva o desempenho multimídia 3D a novas alturas e se baseia nas 21 instruções da tecnologia 3DNow! originalo primeiro conjunto de instruções x86 a usar técnicas de ponto flutuante SIMD super-escalares. A tecnologia 3DNow! Otimizada adiciona 24 novas instruções19 para otimizar os cálculos matemáticos com inteiros do MMX™ e aperfeiçoar a movimentação de dados para aplicativos de transmissão de dados pela Internet e 5 extensões DSP para aplicativos soft modem, soft ADSL, Dolby Digital e MP3. Este novo recurso DSP do AMD Athlon não é suportado pelo Pentium III.
Arquitetura do Cache: O AMD Athlon compreende o maior cache L1 (total de 128KB) para plataformas x86. O AMD Athlon apresenta também um controlador de cache L2 traseiro de 64 bits de alta velocidade que suporta tamanhos de cache L2 que variam de 512KB a maciços 8MB. Este projeto superior de cache tira vantagem do barramento de sistema de alta velocidade do processador e minimiza estreitamentos de largura de banda.

Processador Athlon: resumo da principais característica e inovações:

primeira micro-arquitetura de processador x86 super-escalar em superpipeline de nove estágios projetada para altas freqüências de clock
Múltiplos decodificadores paralelos de instruções x86
Três unidades de execução de ponto flutuante totalmente em pipeline super-escalares e sem ordem, que executam todas as instruções de x87 (ponto flutuante), MMX e 3DNow!
Três unidades de inteiros em pipeline super-escalares e sem ordem
Três unidades de cálculo de endereço em pipeline super-escalares e sem ordem Unidade de controle de instruções de 72 entradas Previsão de desvios dinâmica avançada Tecnologia 3DNow! Otimizada para um desempenho 3D de primeira ordem 21 instruções 3DNow! originaisa primeira tecnologia a permitir SIMD super-escalar 19 novas instruções para capacitar cálculos matemáticos melhorados com inteiros para codificação de voz ou vídeo e movimentação de dados melhorada para plug-ins de Internet e outros aplicativos de transmissão 5 novas instruções DSP para aprimorar aplicações de soft modem, soft ADSL, som surround Dolby Digital e MP3 Compatível com Windows 98, Windows 95 e Windows NT 4.x sem correção de software O barramento de sistema de 200 MHz do AMD Athlon (escalável para além de 400 MHz), permitindo largura de banda de sistema de primeira linha para aplicativos com movimentação intensa de dados Tecnologia de clock síncrono com a origem (repetição de clock) Suporte para ECC de 8 bits para integridade do barramento de dados Largura máxima de banda de 1,6 a 3,2 GB/s
Suporte para multiprocessamento: topologia ponto-a-ponto, com o número de processadores em sistemas SMP determinado pela implementação do chipset Suporte para 24 transações importantes por processador Arquitetura de cache de alta -performance com um cache L1 integrado de 128 KB e uma interface de cache traseiro L2 programável de alta velocidade Projeto de infra-estrutura de Slot A baseado em plataformas otimizadas de alto desempenho Disponível em cartucho de processador com dimensões mecânicas comparáveis ao Pentium III Alavanca a infra-estrutura de PC Slot 1 física/mecânica existente, incluindo conector mecânico, mas com diferentes protocolos de barramento e definições elétricas Interface elétrica compatível com barramento de sistema AMD Athlon de 200 MHz, baseado no protocolo de barramento Alpha EV6 Suportado por uma linha completa de soluções de infra-estrutura Slot A otimizada (chipset’s, motherboards, BIOS)
Tamanho do die: aproximadamente 22 milhões de transistores em die de 184 mm2 com tecnologia de processamento de 0,25 mícron Fabricado com a tecnologia de processamento de última geração de 0,25 mícron e seis camadas de metal da AMD na fábrica de wafers Fab. 25 da AMD

Existe uma nova versão do processador Athlon, nome-código Thunderbird, que não tem um novo nome comercial e está sendo chamado simplesmente de “novo Athlon” pela AMD. Esse processador tem 256 KB de memória cache L2 trabalhando na mesma freqüência de operação do processador e usa o soquete A, o mesmo tipo de soquete que o processador Duron.

Apesar de o novo Athlon ter menos memória cache que o Athlon convencional, é bem provável que ele seja mais rápido, já que estará sendo acessado na mesma freqüência de operação do processador e não na metade desta, como ocorre no Athlon convencional..

Há ainda a previsão do lançamento de processadores AMD com freqüência de operação externa de 266 MHz até o final do ano.

Com certeza esses 266 MHz serão obtidos da mesma forma que o Athlon e o Duron obtém os seus 200 MHz, isto é, usando a tecnologia DDR (Double Data Rate).

Funciona da seguinte forma: normalmente, os processadores só transferem dados na subida do pulso de clock, isto é, quanto ele passa de 0 para 1. Os processadores Athlon e Duron transferem dados tanto na subida quanto na descida do pulso de clock (quando o clock passa de 1 para 0). Dessa forma, em vez de transferir um dado por pulso de clock, esses processadores transferem dois. Por isso que, apesar de fisicamente a freqüência de operação desses processadores ser de 100 MHz, dizemos que eles têm uma freqüência de operação de 200 MHz (na verdade eles obtém um desempenho igual a se estivessem trabalhando a 200 MHz).

O mesmo ocorrerá com a freqüência de 266 MHz: os processadores trabalharão a 133 MHz externamente transferindo dois dados por pulso de clock, dobrando o desempenho (ou seja, trabalhando como se estivessem a 266 MHz).A AMD está ainda trabalhando em uma nova versão do Athlon, nome-código Mustang, que terá até 1 MB de memória cache dentro do processador.

Processador

A Cyrix desenvolveu seus próprios processadores do início ao fim sem tecnologia da Intel. No entanto, a Intel ainda afirma que o design da Cyrix viola suas patentes. A solução da Cyrix para esse impasse legal foi, em lugar disso, produzir seus dispositivos em fabricantes que tivessem acordos de licença de patente com a Intel. Este procedimento parece ter funcionado. assim como a AMD, a Cyrix também está buscando um caminho para novos design que não infrinjam a lei. A estratégia inicial de marketing da Cyrix era não produzir clones exatos dos processadores Intel. Seus produtos na verdade híbridos de processadores 386 e 486.

Atualmente a Cyrix pertence a VIA Technologies Inc, e passa a se chamar VIA Cyrix.Com essa compra, ao que tudo indica a VIA terá força suficiente para combater, de frente, a Intel e a AMD. Integrated Device Technology Todos os processadores na tabela 1 são semelhantes ao 486, os que os diferenciam é os tornam mais rápidos são, pipelines de cinco estágios, o que permite que sejam executadas muitas instruções em ciclos únicos de clock.

Além disso, foi acrescentado pequenos caches de instrução e de dados de 1Kb. Slot’s de encaixe são idênticos aos do 486 da Intel.

6×86

Conexão em Soquete 7, mesma coisa que o Pentium só que a execução dele não é por ordem especulativa, aumentando seu desempenho, 0.35 µm operando a 32 bits. O cache de memória interno (L1) desse processador é de 64 KB e ele opera externamente a 66 MHz.

6×86 MX

Idêntico ao 6×86 mas com instruções MMX.

MII

MII é o novo nome do processador 6x86MX da Cyrix que, por questões de marketing, resolveram trocar o nome.

O grande cuidado a ser tomado com esse processador é a sua nomenclatura “PR”, que indica a equivalência do desempenho do processador a um Pentium MMX. Exemplo, um MII-PR300, que trabalha internamente a 233 MHz, similarmente a um Pentium MMX – ou seja, segundo o fabricante, esse processador teria um desempenho equivalente a um Pentium MMX-300. Como não existe no mercado o processador Pentium MMX-300, não pudemos comprovar se a nomenclatura “PR-300” é verdadeira ou não.

MIIe

Cyrix MIIe (“Cayenne”): O sucessor do 6x86MX ou MII. Além de trabalhar externamente a 100 MHz e utilizar a tecnologia 3D, sua principal mudança em relação aos processadores anteriores da Cyrix é que seu coprocessador matemático foi redesenhado, já que o coprocessador do 6x86MX e do 6×86 possui performance inferior ao coprocessador matemático dos processadores Intel e AMD.

Media Gx

Para computadores baratos, tem recursos como processador de vídeo, controle dos slot’s PCI, áudio e memória no próprio chip, sua única diferença é o preço, seu núcleo possui 0,25 µm, opera a 32 bits, MMX, sua freqüências internas são de 266Mhz ou mais.

Cyrix III

Recentemente a VIA anunciou o lançamento de seu primeiro processador, chamado Cyrix III. Esse processador é o primeiro processador não Intel a usar o padrão de pinagem soquete 370, isto é, ele usa o mesmo tipo de placa-mãe originalmente projetada para o processador Celeron, da Intel.

Internamente, o Cyrix III tem 128 KB de memória cache L1 e 256 KB de memória cache L2, trabalhando na mesma freqüência de operação interna do processador, é fabricado em forma de soquete, usando a mesma placa-mãe projetada para o Celeron (soquete 370). Na tabela a seguir você compara as características internas dos processadores concorrentes do Cyrix III, lembrando que, quanto maior o tamanho do cache de memória, mais rápido é o processador. Outras características do Cyrix III incluem o uso da tecnologia MMX e da tecnologia 3DNow! núcleo com 0.18µm. Operando de 500 a 700Mhz, com consumo médio de 10Watts.

Via C3

Com nova tecnologia de núcleo com 0.15µm, ele pode ter melhor performance com baixo consumo de energia e menor tamanho, usa o padrão de pinagem soquete 370, isto é, ele usa o mesmo tipo de placa-mãe originalmente projetada para o processador Celeron, da Intel, com 192Kb de cache L1+L2, ele é considerado o menor processador com 52mm2. Inicialmente operando nas velocidades de 733MHz e 750MHz com 128Kb L1 e 64Kb L2 acessados na velocidade do processador. Suporta freqüência de 66, 100 e 133Mhz no barramento externo, compatível com MMX e 3DNOW!

Crusoe

Os processadores Crusoe são usados principalmente pelas empresas de computadores portáteis.

Crusoe TM3200

O TM3200 é usado principalmente em computadores moveis com acesso a internet ele é designado para operar com Web Browser’s com baixo consumo de energia. É usado também em computadores Laptop com Linux, possuí um a capacidade de entrar em stand-by automaticamente com consumos de somente 20 mW.

Crusoe TM5400/TM5600

O TM5400/TM5600 resolve os problemas das baterias de curta vida com consumos máximos de 60 mW auto regulados. Usado em computadores desktop ele roda sem problemas aplicativos Windows e Linux com desempenho superior para decodificação de DVD’s, consumindo 2W a mais quando decodificando.

WinChip-2

Desempenho de processamento: O desempenho de processamento do WinChip-2 é similar ao do Celeron-A, porém bem inferior ao desempenho obtido pelos processadores K6-2 e ao Pentium II. Todavia, é importante notar que o WinChip-2 não é um processador destinado a micros de alto desempenho, mas sim micros baratos. Dessa forma, o WinChip-2 briga de frente com o processador Celeron da Intel, oferecendo uma alternativa mais atraente para micros baratos.

Utiliza pinagem soquete 7 (o mesmo padrão do Pentium, Pentium MMX, MII, K6, K6-2 e K6-III) e possui os mesmos recursos do K6-2 da AMD. Trabalha externamente a 100 MHz e possui a tecnologia 3DNow!. Possui o co- processador e a sua unidade MMX em arquitetura superescalar, o que permite que duas instruções MMX ou matemáticas possam ser executadas simultaneamente. Da mesma forma que o K6-2, alguns modelos do WinChip-2 trabalham externamente a 66 MHz.

Alimentado com 3,52 V, os modelos de 66 MHz podem ser instalados em qualquer placa-mãe originalmente desenhada para o processador Pentium, ou seja, qualquer placa-mãe soquete 7 aceita os processadores WinChip-2 de 66 MHz. Já os modelos de 100 MHz necessitam obrigatoriamente de placas-mãe Super7, que são placas-mãe soquete 7 que operam a 100 MHz. Além disso, o uso de memórias PC-100 é imprescindível. Na hora da escolha de uma placa- mãe para os modelos de 100 MHz, você deverá verificar se a placa-mãe é capaz de alimentar o processador com 3,52V.

Modelo freqüência de operação interna freqüência de operação externa:

WinChip-2-200 200MHz 66MHz. WinChip-2-233 233MHz 66MHz. WinChip-2-266 233MHz 100MHz. WinChip-2-300 250MHz 100MHz.

WinChip-3

Processador com 128 KB de cache L2 integrado. O WinChip-3 continuará sendo destinado a placas-mãe Super7 e, com isso, ele poderá utilizar o cache de memória existente na placa-mãe como um cache L3, o que aumentará muito o seu desempenho. Essa mesma arquitetura é utilizada pelo processador K6-III da AMD.

WinChip C6

Existem 2 modelos um que pode ser acoplados em Socket 7 e Socket 5 ambos possuindo mesmas especificações. Clock único de 200MHZ, estilo x86, com tamanho (núcleo) 88mm2 a 0.35mícron, usa cincos estágios de execução Pipeline. Usa uma arquitetura simplificada de execução de código que aumenta sua performance, possui 5.4 milhões de transistores.

WinChip C6+

Processador com baixo consumo de energia, estilo x86, com tamanho de 90mm2, tecnologia de 0.30mícron e usada cinco estágios de execução de pipeline. Vem com 56 novas instruções e MMX, opera a clock’s de 266 a 300Mhz, compatível com Socket 7, possui 5.8 milhões de transistores.

Texas Instruments

A TI era uma fonte alternativa para os dispositivos 486SLC e DLC da Cyrix, e também desenvolveu suas próprias versões com caches maiores e interface de barramento PCI incorporado. Os últimos processadores fabricados por essa empresa TI486SXL2 e SXLC2, ambos com clock’s duplicados, aceitando um cache de 8kb. O dispositivo SXL é um dispositivo de pinagem 486, e o SXLC é um despositivo de pinagem i386SX. Todos possuindo versões de 3,3V, operando a velocidades de até 40Mhz.

X86 da IBM

Acordos com a Intel permitem que a IBM tenha acesso aos design 386 e 486, mas a impedem de vende-los sozinhos, eles precisam estar montados em placas ou em módulos.

A IBM desenvolveu 3 produtos básicos : o 386SLC, o 486SLC2 e o Blue Lighting. O 386SLC era um processador semelhante ao 486 com um cache de 8Kb num gabinete de pinagem 386SX da Intel, e opera a 20 e 25 Mhz. O 486SLC2 era o mesmo processador Intel 486 mas com 16Kb de cache, operando a 66Mhz internamente. Esse dispositivo era também comercializado na pinagem 386SX da Intel. O Blue Lighting era semelhante ao 486, mas foi recondicionado na pinagem do 386 da Intel, trabalhando de 75 a 100 Mhz, Atualmente a IBM fabrica somente processadores com tecnologia RISC.

NexGen

Em 1993, a NexGen produziu um conjunto de chips que chamou de NX586, que não oferecia vantagem sobre o Pentium da Intel, composto de um único chip. Desde então, o conjunto o conjunto de chip’s da NexGen encolheu de tamanho, e acabou se formando um dispositivo de chip único fabricado pela IBM e que utilizava uma tecnologia de 0,5 mícron. Ele oferece pouco em termos de desempenho e competiu apenas no preço. Esse processador não chegou a ocupar lugar no mercado pois não era compatível com principais novidades, exemplo PCI.

Processadores Para o Próximo Milênio

Postulados de Von Neumann

Von Neumann, que trabalhou no desenvolvimento do ENIAC e posteriormente empregou sua experiência no projeto do IAS (1952), elaborou as idéias e os conceitos que nortearam a arquitetura dos computadores até os dias de hoje. Seu entendimento é essencial para apreciarmos a atual evolução dos computadores.

Iniciemos constatando, de forma óbvia, que as máquinas que usamos nas nossas casas possuem quatro elementos básicos: a CPU, a memória, os dados e as instruções (ou programas).

A partir daí, apresentamos os três postulados básicos de von Neumann, que no momento podem parecer triviais, mas que não o eram na década de 50:

1. Um único controle centralizado (uma só CPU);
2. Uma única memória para dados e instruções; e
3. As instruções devem fazer operações elementares sobre os dados.

Cerca de 90% dos computadores atuais usam esses postulados e por isso são chamados de Arquitetura de von Neumann ou , Arquitetura Serial pois, empregam um único processador. Essa arquitetura, aliada aos avanços da microeletrônica, ofertou-nos o atual mercado de computadores, rápidos e baratos.

Porém, tal arquitetura enfrenta um limite de velocidade que é ditado pelas leis da física. O tempo que um sinal elétrico gasta para trafegar entre dois pontos de um circuito eletrônico é muito pequeno, porém não é igual a zero. Em outras palavras, isto corresponde a dizer que existe um limite para a velocidade de relógio das CPU’s e, infelizmente, ele não está muito distante. Como então continuar com a evolução dos computadores? Essa é a pergunta que tem ocupado a cabeça de muitos pesquisadores e desde a segunda metade desta década, várias soluções foram propostas.

A principal resposta vem da comparação entre nosso cérebro e um processador. É sabido que o sinal elétrico trafegando por dentro de um CI é muito mais veloz que o trânsito de impulsos nervosos entre nossos neurônios.

É claro que, para fazer operações numéricas, comparar e classificar, o computador é mais rápido. Mas, por outro lado, ele é inferior, pois não pensa, não inova e não aprende, apenas segue passos programados. Por exemplo, com um único olhar em uma sala identificamos imediatamente centenas de objetos. Já um computador, mesmo o mais sofisticado, apenas consegue identificar os objetos mais simples.

Somos capazes de dirigir um carro e enquanto andamos por nossas (terríveis) estradas, temos habilidade para escolher o melhor caminho. Será que um computador pode dirigir um carro? Uma das experiências no MIT com um piloto computadorizado, que identificava a rua através das linhas paralelas do meio fio, revelou um grande escalador de árvores, pois ele confundia o contorno do meio fio com o contorno do caule das árvores.

Como será que o cérebro consegue ser superior aos processadores, se o nosso neurônio é muito mais lento que um circuito eletrônico?

A resposta é óbvia: porque temos vários bilhões de neurônios operando em paralelo. Ora, por que, ao invés de construirmos CPU’s velozes e gigantescas, não usamos várias CPU’s, simples e confiáveis, operando em paralelo? Chegamos assim à idéia básica do processamento paralelo, que é a esperança para o próximo milênio.

Processamento Paralelo

Sabemos então que devemos usar uma grande quantidade de processadores, mas como controlá-los de forma a que façam alguma coisa de útil? Existem grandes problemas! Para iniciar, vamos trabalhar o conceito de processamento paralelo através de um exemplo bem simples. Se um pedreiro constrói uma casa em um ano, então dois pedreiros constroem a mesma casa em meio ano.

Este é conceito básico do processamento paralelo: a divisão das tarefas.

Podemos seguir adiante e concluir que cem pedreiros gastam apenas 3,6 dias.

Será isto um absurdo?

É claro que há um limite, pois o trabalho dos pedreiros só será eficiente se estiverem perfeitamente sincronizados e equilibrados.

Este ponto é importante: todos os pedreiros devem ter a mesma carga de trabalho. Em termos técnicos, usa-se a expressão Balanceamento da Carga de Trabalho

Esse balanceamento pode ser feito de dois modos. No primeiro modo, o trabalho de cada pedreiro é idêntico, ou seja, cada um faz 1/100 da casa. No outro modo é usado a especialização, ou seja, alguns pedreiros viram cimento enquanto outros assentam tijolos e outros tratam do encanamento, e assim por diante.

Ao imaginarmos todas as tarefas que devam ser executadas para a construção da casa, fica claro que algumas delas não poderão ser paralelizadas. Imagine 100 pedreiros para colocar um porta, ou 100 pedreiros em cima da casa tentando montar o telhado. A casa acabaria por cair! Além disso, deve haver um limite para a quantidade de pedreiros que podem trabalhar em paralelo. A partir deste limite, quanto mais pedreiros colocamos, pioramos o desempenho e em conseqüência, aumentamos o tempo de construção.

Temos então dois grandes problemas: até quanto podemos paralelizar uma tarefa e até quantos processadores devem ser alocados?

A partir daí, surgem outras questões: como sincronizar esses processadores de forma a que um não repita o trabalho do outro e como garantir o balanceamento da carga de trabalho?

Agora temos condições de entender porque se diz que as dificuldades presentes no projeto do hardware de máquinas paralelas não são tão complexas quando comparados com os problemas de sua programação. Diz-se que os computadores estão sempre uma geração atrasada em relação às nossas necessidades e os programas, duas gerações atrasadas. Em suma, um desafio maior que o projeto de supercomputadores é a sua programação.

Classificação de Computadores Paralelos

É muito difícil a tarefa de classificar computadores paralelos. Já foram feitas diversas sugestões. A classificação definitiva ainda está por vir. Porém, a que trouxe melhores resultados e ainda hoje é usada, é a proposta por Flynn.

Essa classificação está baseada em dois conceitos: fluxo de instruções e fluxo de dados. O fluxo de instruções está relacionado com o programa que o processador executa, enquanto que o fluxo de dados está relacionado com os operandos manipulados por essas instruções. O fluxo de instruções e o fluxo de dados são considerados independentes e por isso existem quatro combinações possíveis.

SISD – Instrução Única, Dado Único (Single Instruction Single Data)

Essa arquitetura é usada nos computadores que temos em casa. Segue o proposto por von Neumann e é por isso denominada de Arquitetura de von Neumann também chamado de computador serial. Temos um único fluxo de , instruções (SI), caracterizado pelo contador de programa da CPU, que opera sobre um único dado (SD) por vez.

SIMD – Única Instrução, Múltiplos Dados (Single Instruction Multiple Data)

De início esta arquitetura paralela pode parecer estranha, mas como será constatado adiante, ela não só é conhecida, como também já foi muito utilizada. Um grande exemplo desta arquitetura são os computadores Cray. Outro exemplo é o conjunto de instruções MMX. Eles são muito usados quando um mesmo programa deve ser executado sobre uma grande massa de dados, como é o caso de prospeção de petróleo. Note que essa arquitetura não sofre com problemas de sincronização, pois existe um único programa em execução.

MISD – Múltiplas Instruções, Dado Único (Multiple Instruction Single Data)

Essa arquitetura é um pouco mais difícil de ser explicada. Tentemos imaginar como é que se pode fazer múltiplas operações (MI) sobre um mesmo dado (SD). Os próprios pesquisadores têm opiniões divergentes sobre esse assunto.

MIMD – Múltiplas Instruções, Múltiplos Dados (Multiple Instruction Multiple Data)

Essa é a arquitetura que esperaríamos encontrar em um computador paralelo. Temos vários dados (MD) sendo operados por vários instruções (MI), simultaneamente. Essa é a arquitetura mais usada pelos modernos supercomputadores. Nesse caso, é importante que os processadores possam se comunicar entre si para fazer a sincronização e trocar informações. Além disso, é necessário ter uma memória, chamada de global, onde todos processadores possam disponibilizar, para os demais, os resultados intermediários.

Para evitar uma quantidade excessiva de acessos a essa memória, os processadores possuem a chamada memória local, onde está a maioria das suas instruções e dos dados que devam ser operados. Essa memória local evita que a estrutura de comunicação se transforme num enorme gargalo. Os processadores precisam trocar informações e, no caso desta figura, a própria estrutura de comunicação se encarrega desta tarefa.

Agora sim é necessária a genialidade dos programadores, pois como conseguir que uma estrutura deste tipo, imagine 1.024 processadores, trabalhe de forma sincronizada para gerar algum resultado? Se já é difícil escrever e depurar programas seriais, imagine fazer isso em um computador com 1.024 diferentes programas trabalhando sobre 1.024 dados diferentes.

Ganho de Velocidade

Como medir o quanto se ganhou com a execução de uma tarefa em um computador paralelo? É intuitivo que devemos usar o tempo de execução para medir esse desempenho, já que nosso principal objetivo é aumentar a velocidade de processamento. Uma solução boa é verificarmos a relação entre os tempos gastos para executar essa tarefa em um computador serial e em um computador paralelo. A expressão a seguir é usada para o cálculo do Ganho de Velocidade, que é abreviado pela sigla GV.

Por exemplo, uma determinada tarefa, quando executada em um computador convencional consome 200 s e quando executada em uma máquina paralela (24 processadores) consome 10 s, então o ganho de velocidade é GV = 200/10 = 20.

Gostaríamos que o Ganho de Velocidade fosse igual à quantidade de Elementos de Processamento (EP) empregados, mas isso é raro de acontecer pois quando se escreve um programa para rodar em máquinas paralelas, invariavelmente se necessita colocar trechos extras (de programa) para sincronização dos diversos EP e troca de informações. Esses trechos extras recebem o nome de custo de paralelização. Dependendo da tarefa a ser executada, pode haver uma necessidade de sincronização e troca informações tão grande que venha a inviabilizar o processamento paralelo.

Lei de Amdhal

Apesar do quanto promissor a computação paralela possa parecer, ela não é uma solução para todo o problema de processamento. Existem tarefas que são eminentemente seqüenciais e que não tiram proveito de um computador paralelo. Voltando ao nosso exemplo da construção de uma casa, apesar dela ser executada em paralelo, existe por detrás uma seqüência que deve ser obedecida. Nessa construção, não podemos fazer o telhado antes de termos as paredes prontas e também não podemos construir as paredes antes do alicerce. Assim, é comum que as tarefas a serem executadas possuam porções paralelizáveis e porções que precisam ser executadas de forma seqüencial. Note que um computador paralelo operando de forma seqüencial é um grande desperdício, pois enquanto um processador trabalha no trecho serial, todos os demais ficam ociosos.

Conclusão

O Processamento paralelo com certeza será um grande passo na evolução dos computadores, mas ela está apenas “no ovo” e vai demorar algum tempo para que realmente atinja resultados satisfatórios.

Felipe Tusset

Fonte: equipe.nce.ufrj.br