64d1b7044a898 0
Share

Review – SSD DapuStor Roealsen R5100 7.68TB – Um dos melhores SSDs Gen4 para datacenter que já testamos!

Hoje, testaremos um SSD de Datacenter NVMe da DapuStor, do segmento topo de linha Gen4, modelo Roealsen R5100, que é um dos SSDs que eles oferecem no formato U.2. Um agradecimento especial a equipe da DapuStor por ter nos enviado este SSD para teste diretamente da China.

Ele vem em um formato diferenciado chamado de U.2, que se aparenta com o antigo conector SATA de 2.5″, porém, com um barramento de 64Gbps, ou seja, 4 linhas PCIe 4.0, protocolo NVMe 1.4 e capacidades que variam desde 1.92TB até 15.36TB. Seu preço é cerca de U$900 à U$950 (unidade de 7.68TB), mas pode variar, mostrando ser um preço bem competitivo, pouco acima do que um SSD do mercado consumidor costuma ser, como por exemplo, se pegarmos SSDS M.2 de 8TB vemos que ficam próximos dos U$800~U$900.

Screenshot 2024 08 23 125930

Interessante mencionar que a Dapustor disponibiliza esse line-up no formato U.2 além do HHHL AIC.

U.2 x SATA Connector

Podemos observar que o Pin-Out de ambos esses conectores são bem diferentes, com o SATA, são 2 conectores enquanto o U.2 usa apenas 1, isso sem mencionar que o conector SATA utiliza protocolo AHCI para se comunicar com o HOST, enquanto aqui, ele utiliza o protocolo NVMe 1.4 com barramento PCIe 4.0 x4.

Especificações do SSD

A seguir, informações um pouco mais detalhadas sobre o SSD que será testado (unidade de 7.68TB):

Dapustor Line up PTBR

Softwares do SSD

A DapuStor não oferece uma suite de softwares de gerenciamento, porém é totalmente possível realizar diagnósticos através de softwares de terceiros e update de firmware pode ser feito por linhas de comando.

Unboxing

Na parte frontal do SSD temos um design elegante com carcaça em alumínio na cor preta que auxilia na dissipação de calor do SSD, com uma etiqueta com informações do produto. Enquanto que na parte traseira, não temos nenhum adesivo, apenas sua carcaça de alumínio.

Para abrirmos o SSD, existem 4 parafusos do tipo Torx T6H, 2 em cada lado do SSD, onde um destes parafusos fica coberto pelo selo de garantia, que ao ser rompido, anula tal garantia.

Logo ao removermos os 4 parafusos e tirarmos a tampa frontal, nos deparamos com seu PCB repleto de thermalpads. Observamos também que o PCB é fixada na carcaça por mais 4 parafusos, que desta vez são Phillips

Agora, observamos ambos os lados do PCB. Na imagem da esquerda vemos seu PCB traseiro repleto de componentes, tais como 5 módulos de DRAM Cache, 8 NAND Flashs e inúmeros circuito integrados que integram o VRM.

Ja na imagem da direita vemos a parte frontal do seu PCB, aonde localiza-se seu controlador, mais 5 módulos DRAM Cache junto de mais 8 NAND Flashs. Além de mais um grande número de componentes do VRM, e não podemos esquecer de seu imenso capacitor responsável pelo setor de Power Loss Protection.

Ele acompanha por padrão um volume de 14.5% alocado para over-provisioning, ou seja, dos 8192GB de armazenamento, temos 7.680GB disponível para o usuário.

Controlador
O controlador do SSD é o responsável por fazer todo o gerenciamento de dados, over provisioning e garbage collection, dentre outras funções que ocorrem em segundo plano. E, é claro, isso faz com que o SSD tenha um bom desempenho.

SSD Dapustor Roalsen R5100 7.68TB Controller

SSDs de Datacenter não costumam utilizar os controladores que vemos em SSDs do mercado consumidor, portanto, não veremos aquele controlador Phison E18 ou outros controladores como o Silicon Motion SM2264.

Nesse SSD, a DapuStor desenvolveu seu próprio controlador que veremos um pouco mais agora, o DPU616

image 1

Por se tratar de um controlador de Datacenter, existem certos features que não costumamos ver em todos os demais controladores de SSDs do mercado consumidor.

Este controlador possui uma arquitetura ARM 64-bit com 8 núcleos Cortex-A53 (Hexa-core) que trabalham com uma velocidade de 1.8GHz. Esses são os mesmos tipos de núcleos ARM que podemos encontrar em dispositivos como os Raspberry Pi 3, e alguns SoC de smartphones como o MediaTek Helio G36.

Este line-up de controladores também possui 2 versões, a DPU608 e a DPU616, o qual a diferença de ambos esses controladores é a quantidade de canais de NAND Flahs disponíveis. O DPU608 como o nome já indica, possui 8 canais, enquanto que o DPU616, que é o empregado neste projeto, possui 16 canais.

Ele também oferece suporte à DRAM Cache do tipo DDR3 e DDR4 de até 3200 MT/s no DPU616 e 2666 MT/s no DPU608 com interface DDR de 72-bit (64-bit de dados e 8-bit ECC)

Seus 16 canais tem um barramento NV-DDR3 de 1600 MT/s (800 MHz), o que costuma ser uma velocidade semelhante ao que encontramos em SSDs do mercado consumidor como no Phison E18.

A maioria de controladores do ramo de consumidor, o segmento topo de linha como o Phison E18 e o Phison E26 costumam ter suporte até 32 dies (8 Canais e 4 C.E. por canal) enquanto esse da SMI já oferece 16-Canais e 8-C.E. / canal possibilitando até 256-Dies em intercalonamento no DPU616 enquanto que na versão DPU608 ele consegue ter suporte até 256-dies com intercalonamento de até 64-CE.

DRAM Cache ou H.M.B.
Todo SSD topo de linha que visa oferecer um alto desempenho consistente necessita de um buffer para poder armazenar suas tabelas de mapeamento (Flash Translation Layer ou Look-up table). Com isso, ele consegue ter desempenho aleatório melhor e ser mais responsivo.

SSDs de Datacenter também usam muito DRAM Cache para tabelas de mapeamento, porém, nem sempre temos aquele famoso padrão de 1:1000 dos SSDs do mercado consumidor, onde costumamos ver 1GB de DRAM Cache para cada 1TB.

No seu PCB frontal, próximo ao seu controlador, é possível encontrar 5 módulos de DRAM Cache da fabricante taiwanesa Nanya modelo “NT5AD512M16C4-JR” que são módulos do tipo DDR4-3200 MT/s que tem 8Gb (1GB) de densidade cada, um total de 10GB de DRAM Cache.

Entretanto todo esse armazenamento não é alocado apenas para os metadados, alguns GBs podem ser alocados para atuarem como ECC para maior segurança e confiabilidade.

NAND Flash
Com relação a suas NANDs, o SSD de 7.68TB possui 16 chips Nand flash marcadas como “TH58LKT2Y25BA8H“. Tratam-se de Nands da fabricante japonesa Kioxia, modelos BiCS5 eTLC sendo neste caso dies de 512Gb (64GB) contendo 112-Layers de dados e um total de 128 gates, gerando uma array efficiency de 87,5%.

Neste SSD, cada NAND Flash possui 8 dies com 512Gb de densidade, totalizando 512GB por NAND, o que ao todo se gera 8192GB. Elas se comunicam com o controlador com seu barramento de 1200 MT/s.

Algo interessante é que como já haviamos comentado e mostrarei abaixo, as NANDs Kioxia BiCS5 possui algumas variantes, como as de BiCS5 de 2 Planes e de 4 Planes.

No seu projeto original destas NANDs, a Kioxia planejava utilizar estes Dies com 4 planes, o que aumentava drasticamente seu desempenho, além disso, eles tinham o projeto com CuA, que tinha o circuito de gerenciamento da NAND debaixo do array de células, o que aumentava a eficiência de fabricação dessas NANDs. Devido a custos e quantidade de dies por Wafer, a Kioxia costuma fornecer mais NANDs BiCS5 de 2-planes e sem o CuA (Circuitry under Array).

kioxia bics5
Kioxia TLC BiCS5 512Gb – 2-plane vs 4-plabe

Entretanto, nos SSDs Roalsen5 R5101 de 1.92TB e 3.84TB são utilizadas Kioxia eTLC BiCS5 512Gb 4-planes, apenas nas versões de 7.68TB e 15.36TB é que temos as de 2-planes.

Outro fato interessante, como já sabemos SSDs do ramo enterprise, costumam ter NANDs de maior durabilidade, enquanto essas NANDs BiCS5 costumam ter uma durabilidade de 1.700 até 3.000 P.E.C. (Program Erase Cycle) em SSDs do mercado consumidor, essas utilizadas nesse projeto que são eTLC tem uma endurance de 7.000 P.E.C., o que é um valor incrível.

PMIC (Power Delivery)

exemplo pmic

Assim como qualquer componente eletrônico que exerce algum trabalho, SSDs também possuem um nível de consumo de energia que pode variar desde poucos miliwatts  até próximo de 10 W, beirando o limite de alguns conectores ou slots. O circuito responsável por todo gerenciamento de energia é o PMIC, que significa “Power Management IC“, um chip responsável por prover alimentação para demais componentes. 

Neste projeto, na imagem à esquerda vemos um C.I. marcado como “MPPN 8663” que é da fabricante Monolithic Power Systems, que fabricam inúmeros C.I.s de alimentação para SSDs, placas mães, GPUs etc. Neste projeto, esse modelo representa o C.I. “MPQ8633AGLE“, que trata-se de um Synchronous Step-Down Converter com um limitador de corrente ajustável. Ele consegue trabalhar com até 16V, fornecendo uma corrente de até 12A, suportando temperaturas de operação de até 170ºC. Encontramos bastante este modelo em routers, Televisões topo de linha, consoles portateis e etc.

image 1
Monolithic Power Systems – MPQ8633A

Já na imagem da direita, temos outro componente também da M.P.S. que é neste caso o PMIC principal deste projeto. Suportando trabalhar com até 32V fornecendo correntes em pico de até 6A de entrada com mosfets integrados de 14m?.

image 3

Na imagem à esquerda encontramos um componente da fabricante 3Peak cujo modelo é o L930A, ele é um Low-Noise LDO Regulator cujo é um regulador linear de baixa queda de tensão (LDO) que fornece uma saída estável e com baixo ruído, essencial para circuitos sensíveis a interferências, como dispositivos de áudio e SSDs por exemplo. Podendo oferecer correntes de até 3A.

Já este outro componente marcado como “H65” é da Texas Instruments modelo “SN74AUP2G14“, e é um “Low-Power Dual Schmitt-Trigger Inverter“, em SSDs é um componente lógico que consome pouca energia e estabiliza sinais de entrada ruidosos, convertendo-os em sinais digitais bem definidos. Isso ajuda a evitar erros de leitura/escrita ao lidar com sinais instáveis no SSD.

Infelizmente, não conseguimos identificar qual o componente da esquerda, apenas que é um Step-down Converter e que ele atua como um pequeno mosfet, recebendo um input de tensão maior, expelindo uma tensão menor.

Já o C.I. marcado como BKNP (MP28167-A) é outro componente da M.P.S. no qual é um Buck-Boost Converter que ajusta a tensão de entrada para fornecer uma saída estável, seja ela maior, menor ou igual à entrada. Esse componente é especialmente útil em SSDs para manter uma alimentação constante e eficiente, independentemente das variações de energia na fonte, contribuindo para a estabilidade e longevidade do dispositivo. Suportando trabalhar com tensões de 2.8V ~ 22V capaz de fornecer até 3A de corrente de saída e entrada de 4A.

image 5
Monolithic Power Systems – MP28167-A

Este componente “AQQ” da esquerda é outro da Monolithic Power Systems (MP8759), outro Step-down converter, porém, com suporte a entradas de corrente bem maior, suportando trabalhar com até 8A.

image 7
Monolithic Power Systems (MP8759)

Já este “L200” trata-se de um regulador de terminação DDR da 3Peak modelo “TPL51200-S” que é capaz de fornecer e absorver corrente para manter a tensão correta nos terminais de memória DDR. Em SSDs e outros dispositivos que utilizam DDR, ele garante uma terminação estável dos sinais de dados, essencial para a integridade do sinal e desempenho confiável da memória.

image 9
3Peak – TPL51200-S

Na esquerda temos este C.I. “IS25WP128F-JKLE” da fabricante ISSC que é uma memória Flash serial de 128Mb (16MB) que deve ser utilizada para armazenar o Firmware deste SSD ou outros dados de configuração, este C.I. trabalha com frequências de 166 MHz e trabalha entre 1.65V ~ 1.95V.

Já o “3Peak K1031” da 3Peak é um sequenciador de energia de 3 canais com controle de tempo ajustável, usado em SSDs para garantir que múltiplas tensões sejam ativadas na ordem correta. Esse controle evita problemas de inicialização e protege os componentes, ajudando a manter a estabilidade e o desempenho do SSD.

Este “TI 27 15C” é da Texas Instruments cujo modelo é o TCA9803DGKT, um buffer/repetidor I2C com tradução de nível que facilita a comunicação entre dispositivos I2C com diferentes níveis de tensão. Em SSDs, ele garante a integridade dos sinais entre componentes operando em tensões distintas, melhorando a confiabilidade da comunicação e a compatibilidade entre circuitos.

Já o CGWD é da Microne e é um regulador LDO fixo que fornece uma saída estável de 3.0V com capacidade de até 350mA, a partir de uma tensão de entrada entre 2.0V e 6.0V. Com encapsulamento SOT23-5 e marcação “CGxx”, ele é utilizado em SSDs para fornecer uma tensão estável e precisa a componentes sensíveis, assegurando baixo ruído e eficiência energética.

Agradecimentos especiais ao meu colega fzabkar no reddit que me ajudou a descobrir quais componentes são estes.

Power-Loss-Protection

Power Loss Protection em SSDs de Datacenter é fundamental para garantir a integridade dos dados durante falhas de energia. Usando capacitores ou armazenamento de energia temporário, ela permite a conclusão segura de operações em andamento, evitando corrupção de dados em ambientes críticos. Isso assegura alta disponibilidade e confiabilidade dos dados.

Example Power Loss Protection

Esse SSD possui apenas um capacitor eletrolítico da fabricante Nichicon, que é uma das maiores e melhores fabricantes de capacitores do mercado. O modelo deste capacitor é o Nichicon UBY1V182MHL.

SSD Dapustor Roalsen R5100 7.68TB Capacitor

Esse capacitor consegue trabalhar com tensões de até 35V e tem capacitância de 1800?F, podendo funcionar em temperaturas maiores de 135ºC.

Para identificarmos o Hold-up Time de um SSD, que é o tempo que levaria para ele fazer a transferência dos metadados localizados na DRAM (Volátil) de volta para a NAND Flashs (Não-volátil). Para este cálculo utilizamos esta primeira fórmula à seguir:

image 4

Onde:

  • E = Energia armazenada nos capacitores em Joulse (J)
  • C = Capacitância dos capacitore em Farads (F)
  • = Tensão dos capacitores

Então à partir desta equação podemos substituir os parâmetros que sabemos deixando a equação assim:

Etotal = [(1/2) x 1800(?F) x 35² (V)]

Etotal = 1.1025 Joules (J)

Agora que sabemos a quantidade de energia armanezada em todos os 18 capacitores podemos calcular o Hold-up Time utilizando esta equação:

image 6

Onde:

  • T hold-up = Tempo em milisegundos que os capacitores conseguem prover alimentação para o processo de flushing
  • Etotal = Total de energia armazenada nos capacitores
  • P = Consumo elétrico do SSD

Baseado nestes parâmetros podemos substituir com nossos dados para gerar esta fórmula.

T = 1.1025 Joules / 19.94 W (Watts)

T = 0.05529 segundos

Ou seja, neste projeto, esses capacitores conseguem prover um grande tempo de hold up time, onde este tempo de é de aproximadamente 55 milisegundos, o que é considerável.

Lembrando apenas que isto não é um tempo preciso, é apenas um cálculo básico para ilustrar quanto tempo um SSD como este pode ter, na prática, o consumo do SSD não fica tão elevado como neste caso permitindo um Hold-up Time maior.

SSD Power States

Como sempre mencionamos em análises sobre consumo de energia, neste trecho veremos mais sobre os estados de alimentação deste SSD.

Dapustor Roalsen5 R5100 7.68TB Power States English 2

Neste line-up de SSDs vemos que ele acompanha um grupo de 6 power states principais, no qual o PS 0 tem um consumo máximo bem elevado de até 22W embora no uso prático, ele fique próximo dos 18.7W. Além disso ele possui latências bem baixas, permitindo desta maneira uma maior eficiências e rapidez nas transições de power states.

CURIOSIDADES SOBRE O SSD DAPUSTOR R5100

Da mesma forma que circuitos integrados de memória RAM em um pente de memória sofrem variação, o mesmo ocorre com SSDs, nos quais há casos de mudanças de componentes como controlador e NAND flashs.

Até o momento da análise este line-up não tem variantes de hardware.

BANCADA DE TESTES
– Sistema Operacional: Windows Server 2022 64-bit (Build: 22H2)
– CPU: Intel Core i7-13700K (8C/8T) – All Core 5.7GHz – (Hyper-threading e E-cores desabilitados)
– RAM: 2 × 16 GB DDR4-3200MHz CL-16 Netac (w/ XMP)
– Placa Mãe: MSI PRO Z790-P WIFI DDR4 (Bios Rev: 7E06v18)
– GPU: Raptor Lake UHD Graphics 770
– SSD (OS): SSD IronWolf 125 1TB (Firmware: SU3SC011)
– SSD DUT: SSD Dapustor Roealsen5 R5100 7.68TB (Firmware: FF002100)
– Intel Z790 Chipset driver: 10.1.19376.8374.
– Quarch PPM QTL1999 – Medir consumo elétrico.

ONDE COMPRAR

Para aqueles que desejam encontrar este produtos pelos canais oficiais, recomendo que acessem este link.

Dapustor – Onde Comprar

ADAPTADORES
Por se tratar de um SSD com interface U.2 sistemas como PCs de consumidores não tem interface para conectá-los, portanto, temos de usar um adaptador de U.2 para PCIe. No caso, vamos usar um adaptador PCIe 5.0 x4 NVMe.

O único problema é encontrar adaptadores como este para SSDs tão rápidos como estes testados, pois os U.2 para PCIe 3.0 são relativamente acessíveis, sendo encontrados na faixa dos R$200~R$300. Agora este Gen 5.0 custa mais de U$700 sem contar o SSD, apenas o adaptador sozinho.

METODOLOGIA DE TESTES

Por ser um SSD voltado a servidores, não faz sentido testarmos em Benchmark voltados ao mercado consumidor, e por isso vamos utilizar nossa Suite de testes para SSDs de Datacenter/Enterprise.
– É Realizado multiplas vezes o processo de Secure Erase durante cada término de Benchmark
– Para preparar o SSD é escrito no mínimo 2x a capacidade do disco de forma sequencial antes de realizar o Logging
– É realizado Pre-condition do SSD em Queue-Depth Elevado com Workload específico de cada benchmark antes de realizar o Logging
– Após o Disco estar pronto, realizamos a gravação de dados durante 5 minutos para monitoramente do desempenho
– Software Utilizado: IOmeter 1.1

IOmeter – Sequencial e Aleatório

Capturar 3

Sequencial: Blocos 128 KiB 256 Queues 1 Thread

Aleatórios: Blocos 4 KiB 32 Queue 1Threads (100% Alinhado – Escrita / Leitura)

Antes de medirmos suas velocidades o SSD precisa ser “preparado” ou precondicionado, como chamamos em inglês preconditioning, para que o desempenho que ele ofereça seja o desempenho constante, pois SSD possui 3 estados, Fresh-out-of-Box (FOB), o estado de transição (Transitioning) e o Steady State.

F.O.B. representa o estado assim que o SSD começa a ser testado em algum workload, transição como o nome já é alto explicativo é o estado de mudança até chegar no Steady State. E Steady State é o estado de desempenho contínuo aonde o desempenho do SSD não será alterado no workload ele permaneceria neste estado continuamente.

Uma analogia simples de entender estes 3 estados seria esta: Imgaine que você fosse um corredor de maratona e no início da corrida você dá o melhor de si alcançando sua velocidade máxima, só que é fisicamente impossível manter esta velocidade durante todo o percurso, digamos que neste momento de pico você consiga atingir uma média de 15 km/h. Manter esse ritmo durante todo trajeto é impossível, portanto, no decorrer do trajeto você começa a perder velocidade.

Este momento em que sua velocidade começa a oscilar seria o estado de Transitioning, mas logo apos você começar a se estabilizar começaria a correr em uma velocidade que seria mantida até o fim da corrida, esta seria a Steady State.

image046

Começando com um teste de escrita sequencial usando blocos de 128 KiB, podemos perceber que no decorrer do teste, sua velocidade é bem constante, pois como mencionado, este tipo de SSDs não apresenta SLC Cache e suas latências também mostraram bons resultados mesmo neste caso.

Testando agora suas velocidades sequenciais em múltiplas Queue depths, observamos que em sua escrita, em QD2~QD4 ele já consegue saturar o barramento PCIe 4.0 e ficou acima do Memblaze 6530.

Em suas latências, ele apresenta latências menores que o Memblaze 6530, que é seu competidor direto.

Em sua leitura, o mesmo cenário é observado, enquanto o Memblaze satura o barramento próximo de QD32, este SSD da DapuStor consegue saturar o barramento em QD2.

Já suas latências menores, ele ficou muito menor que no Memblaze, ficando até próximo do SSD Gen5.

Benchmark: 4 KiB Random

Vamos agora realizar o preconditioning do SSD para realizar os Benchmarks em 4 KiB.

image012

Podemos observar que o SSD começa gravando a cerca de 1.400 milhões IOPS no seu estado de FOB, porém, logo em seguida, cai drasticamente e depois volta a subir até se estabilizar depois dos 4000 segundos. Este período é o período de transição e em seguida, até o fim do benchmark é o Steady State. Ali ele conseguiu estabilizar um pouco acima dos especificado, ficando na faixa dos 300 mil IOPS.

Este é o mesmo comportamento de suas latências, levando o mesmo tempo para chegar em seu estado de Steady State

Após realizarmos o preconditioning, partimos para o teste de escrita.

De início em QD menores, estas NANDs BiCS5 conseguem proprocionar um desempenho incrível, fazendo com que ele até supere o SSD Gen5 Memblaze 7940 que testamos. E por fim ele se estabiliza na faixa dos 300 mil IOPS, ficando 100 mil IOPS a frente do Memblaze Gen4.

Na sua latência, outro feito incrível! A fabricante anuncia 9µs em QD1, mas ele consegue entregar próximo de 7.5µs o que é supreendente, ficando temporariamente a frente do Gen5 em QD menores.

Já nas suas leituras, ele atinge seus 1.70 milhões de IOps em QD256 ou maiores, algo curioso é que em QD menores ele ficou até mesmo próximo do SSD gen5, ficando bem a frente do Memblaze 6530 que é um Gen4 também.

Em suas latências, a fabricante informa menores que 65µs e realmente ele entrega o prometido, pois em QD1 ele ficou em aproximadamente 64µs.

Benchmark: 4 KiB 70% Leitura 30% Escrita

Uma das métricas mais utilizadas em benchmarks de SSDs que representa múltiplos usos em inúmeros servers e datacenters. Neste benchmark vamos rodar o teste por mais de 16.000 segundos para ver como o SSD se comporta.

image014

Podemos notar que o SSD começa bem com mais de 1.500 milhões IOPs, mas logo em seguida cai e vai se estabilizando até chegar em Steady State na faixa de 650K IOPs após 6000 segundos.

Na latência, ele levou o mesmo tempo para atingir steady state.

Em todas as cargas de trabalho ele consegue fica acima do Memblaze Gen4, porém, ficando levemante abaixo do SSD Gen5 que testamos, outro incrível feito.

Escrita e Leitura Aleatória 8 KiB

Neste trecho do benchmark vamos utilizar como parâmetros blocos de 8 KiB que são bem utilizados em ambientes virtualizados e em cenários OLTP (On-Line Transaction Processing), muito comuns em operações bancárias, compras etc.

image016

Durante os 16.000 segundos de plotagem, vemos que o SSD tanto em sua latência quanto sua largura de banda (IOPS) atingem o ponto de steady state próximo dos 4.000, aonde ele se estabiliza bem rápido. E em seguida, o SSD mantém um desempenho médio de mais de 160K IOPs. Enquanto sua latência se estabiliza abaixo dos 1600µs ou 1.6ms.

No quesito de sua largura de banda em IOPS, ele inicia na frente do Gen5 da Memblaze de QD1~QD2 mas em seguida fica atrás dele, mas ele acaba disparando, ficando bem acima do Memblaze Gen4.

O mesmo pode ser dito de suas latências, sendo bem menores que o SSD Gen4.

Já em sua leitura isso não ocorre, ele fica abaixo do Gen5, mas em QD menores a diferença é bem pequena. E em comparação ao Gen4, a diferença é maior.

Benchmark: OLTP Server Workload

image

Neste trecho do benchmark vamos replicar uma carga de trabalho típica encontrados em servidores que realizam transações bancárias ou outros ambientes de compras on-line que realizam transações e HFT (High Frequency Trading) que trata-se de uma estratégia de negociação financeira que envolve a compra e venda de ativos financeiros, como ações, títulos, moedas e commodities, em alta velocidade e com grande volume de operações.

image022

Ao realizarmos o preconditioning do SSD podemos ver que ele se estabiliza (Steady State) após aproximadamente 5.500 segundos decorridos do benchmark, onde sua largura de banda se estabiliza na faixa acima dos 320K IOPS enquanto sua latência se estabiliza próximo dos 820µs.

Neste cenário vemos que o mesmos e repete, em QD menores ele fica bem próximo do SSD Gen5, porém em QD maiores ele fica atrás do Gen5 porém bem acima do Gen4 em sua largura e banda. O mesmo comportamento é observado em suas latências, como vimos nos benchmarks anteriores.

Benchmark: Web Server Workload

image 1

Neste teste, foi simulado uma carga típica encontrada em “servidores web” que costumam trabalhar bastante com diferentes tamanhos de arquivos e blocos, variando desde 512 bytes até 512KB. Além disto, foi testado também diversas formas de acessos como Leitura e Escrita, e um misto entre os 2 em diferentes porcentagens.

image024

Neste cenário, ele leva aproximadamente cerca de 4000 segundos para atingir o Steady state, com suas latências se estabilizando na faixa dos 3.6ms e sua largura de baixa na faixa dos 75K IOPs.

Neste tipo de workload, observamos que ele teve o mesmo comportamento de outros benchmarks embora a diferença aqui tenha sido menor em QD menores, apenas em QD maiores que vemos uma maior diferença para o Gen4.

O mesmo podemos dizer sobre suas latências, ele consegue latências muito boas mesmo em QD elevadas.

Benchmark: Servidor de Email Workload

image 1 1

Neste trecho da análise, vamos utilizar como base um carga de trabalho típico encontrado em servidores de email cujo tradicionalmente é conhecida por trabalhar com blocos de tamanho 8 KiB com distribuição de 50% / 50% (Leitura/Escrita Aleatória). E também é considerado um cenário mais exigente para escrita no dispositivo.

image020

Podemos constatar que durante esta preparação o SSD levou aproximadamente um pouco mais de 5000 segundos para atingir o Steady State, aonde ele conseguiu ter um desempenho constante na faixa de 250K IOPs com latências próximas de 1100µs.

Neste outro benchmark, começando por sua largura de banda, até QD4 ele lidera entre os demais SSDs, porém acaba sendo ultrapassado apenas pelo SSD da Memblaze, o Gen5, enquanto o Memblaze Gen4 acaba que ficando para trás deste da DapuStor.

Suas latências também foram até parecidas com o Gen5 no início do benchmark ficando apenas atrás do próprio gen5 no restante do teste.

Benchmark: fSync de Escrita

O desempenho de escrita fSync avalia a capacidade de uma unidade de garantir que os dados foram totalmente gravados no disco em cada operação. Aplicações críticas, como bancos de dados e sistemas de alta disponibilidade, dependem do comando fsync() para assegurar a integridade dos dados ao forçar a gravação imediata das informações pendentes.

Ao contrário dos SSDs de consumo, que alcançam altas taxas de IOPS em condições menos exigentes, SSDs empresariais são rigorosamente testados para manter um desempenho consistente de fSync. Essa característica é essencial para garantir a persistência e a estabilidade dos dados em aplicações que demandam alta confiabilidade.

Neste nosso novo benchmark, foi possível observar um desempenho superior no SSD da DapuStor, graças a seus 16 canais que auxiliam no paralelismo, e que acabou ajudando também a ter latências menores, de cerca de 2 micro segundos.

Benchmark: Big Data Analytics Workload

image 4

Neste outro trecho de nosso review vamos simular uma carga de dados encontrada ness ramo, mas o que é BDA? Big data analytics é o processo de examinar e extrair insights valiosos a partir de conjuntos de dados massivos e complexos para tomar decisões informadas e melhorar o desempenho dos negócios. Rodamos durante 5 horas um teste de leitura sequencial com blocos de 1 MiB com 100% de acesso sequencial alinhado.

Durante neste benchmark nosso observamos que o DapuStor tem um excelente desempenho ficando levemente atrás do Memblaze Gen5 e bem a frente do Gen4.

Benchmark: Machine Learning (A.I.)

image 5

Machine Learning é uma subárea da inteligência artificial que se concentra no desenvolvimento de algoritmos e modelos que permitem aos sistemas aprenderem e melhorarem a partir de dados, sem programação explícita. Essa abordagem permite que as máquinas identifiquem padrões, façam previsões e tomem decisões com base nas informações adquiridas, tornando-se uma ferramenta valiosa em uma variedade de aplicações, desde recomendações de produtos até diagnósticos médicos.

Neste benchmark que utilizamos blocos de 32 KiB em leitura Aleatória, o Dapustor em pequenas QD fica na frente disparado, de início até parecia ser algum bug, mas realmente ,o desempenho foi muito elevado devido usar os 16 canais e dies de 512Gb.

Mas em QD maiores a QD de 32 em diante ele já fica para trás do SSD Gen5, mas ainda sim foi um resultado incrível.

IMAGE CLASSIFICATION MODELS – A.I. / MACHINE LEARNING

Este benchmark foi projetado para medir o tempo de carregamento de modelos pesados de classificação de imagens, analisando duas etapas principais: a transferência do modelo do SSD para a memória do CPU e a transferência subsequente para a memória da GPU. Cada modelo é carregado 20 vezes para calcular uma média e o desvio padrão dos tempos, garantindo uma avaliação precisa e consistente.

O propósito deste teste é comparar a eficiência de carregamento entre diferentes arquiteturas de modelos, o que é particularmente relevante para casos em que o tempo de inicialização do modelo impacta a performance de aplicações em ambientes de produção, como sistemas de inferência em tempo real ou ambientes com recursos limitados. Através desses resultados, é possível identificar modelos que oferecem um bom equilíbrio entre performance e tempo de carregamento.

image086

Nestes modelos de classificação de imagem, a diferença entre os SSDs é bem pequena por se tratarem de modelos pequenos, hoje em dia, ouve-se muito sobre as LLM‘s (Large Language Models) que são muito utilizadas em modelos como ChatGPT, gemini, que costumam possuir bilhões e bilhões de parâmetros. Mas em testes como esses talvez possa haver uma diferença.

TESTE DE TEMPERATURA
Neste trecho da análise, observaremos a temperatura do SSD durante um teste de stress, onde o SSD recebe arquivos de forma contínua, para podermos saber se houve algum thermal throtling com seus componentes internos que pudessem gerar algum gargalo ou perda de performance.

image088

Como visto acima, embora o SSD tenha 2 Temperature Targets de 78ºC e 85ºC ele ficou pouco abaixo dessas temperaturas, e devido a isso não sofreu thermal throttling.

E como observamos no vídeo acima que é uma time-lapse durante o benchmark, é possível notar que o exterior de sua carcaça que atua como dissipador chegou a uma temperatura máxima aproximada de 66ºC o que é bem aceitável mas já não é possível manuseá-lo nesta temperatura.

CONSUMO ELÉTRICO E EFICIÊNCIA

SSDs da mesma forma que diversos outros componentes do nosso sistema tem um determinado consumo elétrico. Os mais eficientes conseguem realizar tarefas que foram requisitadas de forma rápida e com um consumo relativamente baixo, para que assim consiga transitar novamente para seus power states em idle aonde tende a ter um consumo menor.

quarch programmable power module
Agradecimento especial a Quarch Solutions por terem enviado esta unidade para testes

Neste trecho da análise utilizaremos o Quarch Programmable Power Module que a Quarch Solutions nos enviou (foto acima) para realizar estes testes e verificar o quão eficiente o SSD é. Nesta metodologia serão realizados 3 testes: O consumo máximo que o SSD possui, uma média em cenários práticos e casuais e em idle.

image090

Embora este SSD tenha seu Power State 0 configurado em 22.5W, ele acaba ficando levemente abaixo disso, dentre todos os testes que realizamos, não foi possível constatar um consumo maior que 20.04W, considerável para um SSD Gen4, levando em consideração que o Memblaze teve 13.25W, mas devemos considerar o fato de que aquele SSD Gen4 tinha a versão do controlador de 8 canais, enquanto este possui 16 o que aumenta e bastante o consumo elétrico.

Quando realizamos nosso teste de preenchimento do SSD, começando com sua escrita, foi possível notar uma média de 19.94W neste benchmark, o que como haviamos mencionado é um consumo bem elevado mas isso pode ser levado em conta devido ao seu controlador de 16 canais e também a quantidade de Dies deste SSD, pois temos 128 dies neste projeto. Já sua largura de banda ficou na média dos 5800 MB/s, um pouco acima do estipulado pelo fabricante.

Já agora no teste de leitura, ele teve um consumo máximo de 6.05W sendo mais eficiênte que os demais SSDs do comparativo. Ultrapassando o Memblaze.

image100

Por último e mais importante, teste em Idle, sendo o cenário em que a esmagadora maioria dos SSDs se encontram no uso do dia a dia ou cotidiano. Embora 5.92W para um SSD M.2 seja um consumo “máximo” bem elevado, um SSD enterprise de datacenter como este tende a ter um consumo bem maior devido aos controladores mais robustos, muitos mais Dies de NAND Flashs, e DRAM Cache, além de inúmeros capacitores e componentes para VRM e para o circuito de Power Loss Protection.

Além do mais, teve o mesmo consumo de um SSD Gen3, o que prova que ele pode ter uma boa eficiência.

image102

Na sua eficiência de escrita, é possível notar que ele fica um pouco abaixo dos Memblaze 6530 que testamos, isso ocorre, devido o consumo deste drive ter sido bem maior que o 6530. Enquanto um ficou na faixa dos 11~13W, o DapuStor ficou na faica dos 19~20W o que é um valor considerável, mesmo que sua largura de banda tenha sido superior ao Memblaze, não foi suficiente para ultrapassa-lo

image104

Já agora em sua leitura, temos um cenário bem diferença, ele consegue uma largura de banda bem interessante e levemente acima do Memblaze com um consumo levemente inferior, e por este motivo que observamos essa leve vantagem em sua eficiência.

Conclusão

Levando tudo isso em conta, realmente será que vale a pena investir neste SSD?

Como haviamos dito no decorrer da análise, este produto é realmente incrível, ele conseguiu oferecer um desempenho que em muitas das vezes é bem próximo do nosso SSD Gen5. Portanto, nesse quesito, ele é um bom competidor. Ainda não sabemos seu preço exato, mas os relatos apontam que ele deve ser competitivo no mercado.

Portanto, SIM, para servidores e empresas de médio e grande porte ele é uma excelente escolha seja como Cache ou armazenamento bruto, para transações, e etc, Recomendaria seu uso para tarefas mais exigentes de armazenamento.

VANTAGENS

  • Ótimas velocidades sequenciais, bem competitivo com outros modelos do mercado
  • Incríveis velocidades aleatórias especialmente em pequenas QD
  • Baixíssimas latências em pequenas QD
  • Perfeito para ambientes como OLTP, HPC, Machine Learning
  • Disponível em múltiplos formatos como: U.2 e AIC HHHL
  • Ótima construção interna com um ótimo controlador e excelente NAND Flashs
  • Boa gama de capacidades disponíveis, variando desde 1.92TB até 15.36TB.
  • Não sofre thermal throttling
  • Não tem variações de Hardware
  • Alta durabilidade
  • Suporta criptografia AES-256 bit / Self-Encrypting Drive
  • Alta eficiência energética em sua leitura
  • Baixo consumo em Idle
  • Garantia de 5 Anos

DESVANTAGENS

  • Não acompanha software de gerenciamento
  • Preço não informado
  • Alto consumo elétrico em cenários de escrita intensa o que fez sua eficiência cair

Você também pode gostar...

Deixe uma resposta