thumb slc cache pichau 9
Share

O impacto do SLC Cache no desempenho de um SSD NVMe – Testes e resultados!

Nesse artigo, faremos algo inédito! Vamos mostrar a real diferença que o SLC Cache tem em um SSD NVMe, a maneira que faremos isso será através dos Mass Production Tools (MPTools), que permitem desabilitar o pSLC Cache de um SSD, deixando com que ele opere em seu modo TLC ou QLC nativo.

Especificações do SSD Cobaia

Line up SSD Pichau Aldrin Pro

O SSD escolhido foi um SSD Pichau Aldrin Pro 2TB, que já testamos há alguns meses atrás e foi disponibilizado pela Pichau para um review e agora para este artigo.

ATENÇÃO ANTES DE SEGUIR COM O ARTIGO!!!

Isso não é um tutorial, afinal, isso infringe a garantia, afeta o desempenho do SSD e este artigo/review tem como intuito apenas ser um conteúdo educativo.

Além da quebra da garantia, AO REALIZAR A GRAVAÇÃO DO FIRMWARE NO SSD, OS DADOS SÃO APAGADOS, portanto, realizem backup dos dispositivos antes de qualquer cosia.

FERRAMENTAS NECESSÁRIAS

Para realizar este procedimento foi necessário utilizar um adaptador de entrada SATA para USB 3.0 com Bridge Chip da Jmicron, modelo JMS578.

Além da pinça para realizar o curto nos terminais do ROM/Safe Mode no PCB do SSD.

Especificações técnicas

Antes de irmos para o processo, vamos analisar um pouco mais deste SSD.

Controlador
O controlador do SSD é o responsável por fazer todo o gerenciamento de dados, over provisioning e garbage collection, dentre outras funções que ocorrem em segundo plano. E, é claro, isso faz com que o SSD tenha um bom desempenho.

SSD Pichau Aldrin Pro 2TB Controller

Este SSD uma um controlador High-end da Innogrit: o IG5236, modelo ISA ARM 32-bit de 4 núcleos Cortex® R5 (Quad-core) com processo de fabricação FinFET CMOS da TSMC de 12nm da mesma forma que o outro tradicional Phison E18. Seus 4 núcleos principais trabalham com clock de 667 MHz, já em comparação do Phison E18, os 3 núcleos trabalham em 1GHz com 2 extras trabalhando em uma frequência bem mais reduzida. Este controlador é encontrado em diversos SSDs topo de linha como XPG Gammix S70, S70 Blade, Asgard AN4, dentre diversos outros modelos.

Neste caso, se trata de um controlador com 8 canais de comunicação com suporte a barramento até ONFI 4.1 ou Toggle 2.0/3.0/4.0, ou seja, um barramento de até 1200 MT/s, sendo que por cada canal de comunicação ele consegue ter um suporte de Interleaving com até 4 conexões Chip Enable, que é um comando e um caminho fisicamente conectado de cada Die até o controlador, permitindo assim ele se comunicar com um máximo de 4 dies por canal, num total de até 32 dies para desempenho máximo.

Ele também oferece suporte para DRAM Cache do tipo DDR3L/DDR4, DR3L/4, LPDDR3/LPDDR4, além de oferecer suporte a diversos tipos de métodos de criptografia como AES, RSA e SHA.

Em resumo, ele não difere tanto em relação ao E18, onde uma das principais diferenças fora a questão da quantidade de núcleos é o barramento, onde o Phison E18 suporta trabalhar em até 1600 MT/s, enquanto este trabalha em até 1200 MT/s, mas para trabalhar em 1600 MT/s, os Dies também precisam suportar trabalhar nesta velocidade e mesmo assim o ganho serial quase imperceptível na maioria dos cenários.

Screenshot 2024 06 11 154946

DRAM Cache ou H.M.B.
Todo SSD topo de linha que visa oferecer um alto desempenho consistente necessita de um buffer para poder armazenar suas tabelas de mapeamento (Flash Translation Layer ou Look-up table). Com isso, ele consegue ter desempenho aleatório melhor e ser mais responsivo.

SSD Pichau Aldrin Pro 2TB DRAM

Notamos que este SSD utiliza 2 módulos de DRAM Cache da fabricante Micron modelo D8BPK que ao utilizar o decoder da própria fabricante temos modelos “MT40A512M16TB-062E:R“, onde cada DRAM Cache possui 8Gb (1 GB) de densidade totalizando 2GB DDR4-3200 MT/s CL22, porém, trabalham em 2666 MT/s devido limitação do controlador de memória interno no Innogrit.

Screenshot 2024 06 11 154959

NAND Flash
Com relação a seus circuitos integrados de armazenamento, o SSD de 2TB possui 4 chips Nand flash “SYMN09TC1B1RC6C”. Tratam-se de Nands da fabricante chinesa YMTC, modelos CDT1B sendo neste caso dies de 512Gb (64GB) contendo 128-Layers de dados e um total de 141 gates, gerando uma array efficiency de 90,7%, aonde das 141-Layers do SSD, 128 são alocadas para armazenamento o que gera esta eficiência.

SSD Pichau Aldrin Pro 2TB NAND Flash

Neste SSD, cada NAND Flash possui 8 dies com 512Gb de densidade, totalizando 512GB por NAND, que ao todo se gera 2TB. Elas se comunicam com o controlador com seu barramento máximo de 1600 MT/s para melhor desempenho.

Cada um destes dies possuem 4 planes para que quando o controlador acesse cada die, possa aumentar o paralelismo e dessa forma o desempenho. Importante destacar que existem 2 modelos de dies YMTC de 128-Layers, os que foram lançados a um tempo atrás conhecidos como CDT1B que também possuem 4 planes como vemos na foto a seguir.

Screenshot 2024 06 11 154946 1

Podemos observar nas imagens acima que o SSD realmente trabalha com suas NANDs em uma velocidade de 1200 MT/s, que é o limite do controlador.

SOFTWARES UTILIZADOS PARA O ESTE PROJETO

Depois de muito tempo de procura, finalmente conseguimos acesso ao Innogrit IG5236 Rainier Mass Production Tool, o software que havia mencionado no artigo do Problema do MN-5236.

E é através desta ferramenta que foram feitas as modificações necessárias para desativar o pSLC Cache do SSD, como vemos na imagem abaixo.

Screenshot 2024 06 11 155105

Ao selecionarmos “Pure XLC“, o “P” significa a NAND em sua forma nativa, como se fosse TLC nativo, MLC nativo ou QLC Nativo. Já o modo Dynamic SLC é como ele vem de fábrica nesta versão de firmware.

No caso esta configuração deixa o SSD com seu SLC Cache de tamanho máximo, ou seja, se o SSD tem 2TB (2000 GB) ele vai alocar aproximadamente entre 660GB à 700GB como pSLC Cache. Até é possível programar um SLC Cache menor ou até mesmo um sistema híbrido ou estático, entretanto, seria necessário um outro arquivo de firmware .bin .

Temos também o modo “Pure SLC”, que é um modo bem interessante, pois diferente do modo Dynamic SLC, ele transforma o SSD inteiro em pseudo-SLC. Desta forma, ao invés do SSD ter seu tamanho normal de 2TB com 660GB de SLC Cache, ele passa a ter apenas um pSLC de 640GB, sendo que o SSD desta maneira nunca entre no modo de escrita nativa ou folding, o que derruba muito o desempenho do SSD. principalmente quando o SSD fica cada vez mais cheio, o que afeta o desempenho.

BANCADA DE TESTES
– Sistema Operacional: Windows 11 Pro 64-bit (Build: 22H2)
– Processador: Intel Core i7 13700K (5.7GHz all core) (E-cores e Hyper-threading desabilitados)
– Memória RAM: 2 × 16 GB DDR4-3200MHz CL-16 Netac (c/ XMP)
– Placa-mãe: MSI Z790-P PRO WIFI D4 (Bios Ver.: 7E06v18)
– Placa de Vídeo: RTX 4060 Galax 1-Click OC (Drivers: 537.xx)
– Armazenamento (OS): SSD Solidigm P44 Pro 2TB (Firmware: 001C)
– SSD testado: SSD Pichau Aldrin Pro 2TB (Firmware: Meu customizado)
– Versão drive Chipset Intel Z790: 10.1.19376.8374.
– Windows: Indexação desabilitada para não afetar resultados dos testes.
– Windows: Atualizações do Windows updates desabilitados para não afetar resultados dos testes.
– Windows: A maioria dos aplicativos do Windows desabilitados de rodar em segundo plano.
– Teste Boot Windows: Imagem limpa com apenas drivers e todos os updates.
– Teste de pSLC Cache: O SSD é arrefecido por fans para não gerar thermal throtling, interferindo no resultado.
– Windows: Anti-Vírus desabilitado para diminuir variação de cada Rodada.
– SSDs Testados: Utilizado como disco secundário, com 0% de espaço sendo utilizado e outros testes com 50% de espaço utilizado para representar um cenário realista.
– Quarch PPM QTL1999 – Teste de consumo elétrico: realizo com 3 parâmetros, em idle aonde o disco é deixado como secundário e após um tempo em idle é realizado a gravação por 1 hora e tirado a média.

CONTRIBUIÇÃO PARA PROJETOS COMO ESTE NO FUTURO

Caso tenham gostado deste artigo e gostariam de ver mais artigos como este, estarei deixando a seguir um link onde é possível contribuir diretamente.

Link comissionado de Contribuição

TESTE DE VELOCIDADE SUSTENTADA | SLC CACHING
Boa parte de SSDs no mercado atualmente utiliza como base a tecnologia de SLC Caching, em que certo percentual de sua capacidade de armazenamento, seja ele MLC (2 bits p/ célula), TLC (3 bits p/ célula) ou QLC (4 bits p/ célula), é usado para armazenar apenas 1 bit por célula. No caso, é usada como um buffer de escrita e leitura, em que o controlador inicia a gravação e quando o Buffer se esgota ele escreve nas NAND Flash nativas (MLC / TLC / QLC).

image 7

Costumamos começar nossos testes com os benchmarks do CDM, e outros para próximo do fim testarmos o SLC Cache, mas desta vez foi feito diferente, para que possam ver que realmente o pSLC Cache do SSD foi desabilitado.

image 9

Através do IOmeter, podemos ter uma ideia do volume de SLC cache deste SSD, já que o fabricante muita vezes não informa este valor. Pelos testes que realizamos, foi possível constatar que ele possui um volume de pSLC Cache que aparenta ser dinâmico, imenso, de cerca de 691GB, ele conseguiu manter velocidade média de ~ 6579MB/s até o fim do buffer, o que foi uma velocidade boa considerando que essa é uma unidade SSD PCIe 4.0 de 2TB com 32 dies.

Após ter gravado 691GB, ele começou a gravar nos blocos programados nativamente como TLC, onde sua velocidade média foi de aproximadamente 2159 MB/s, o que é excelente. E ele gravou nesta média de 693GB até cerca de 868GB, ou cerca de 175GB a uma média de quase 2200 MB/s.

Após 868GB, ele começou o processo de folding, onde reprogramou os blocos que estavam em modo pSLC de volta para TLC, resultado em uma queda grande de desempenho. O SSD manteve uma velocidade média de escrita de 863 MB/s até encher a unidade.

image045

Agora, podemos observar que com o pSLC Cache desabilitado o desempenho do SSD caiu bastante, ele nunca mais irá alcançar as velocidades de mais de 6000 MB/s, a não ser que reativemos o pSLC Cache do SSD.

Entretanto, algo vantajoso ao desativar o pSLC Cache é a consistência do desempenho. Neste caso o SSD se mantém de forma constante e estável acima dos 2100 MB/s do início ao fim do teste, e não cai abaixo disto, a não ser que esteja sofrendo thermal throttling.

CRYSTALDISKMARK
Realizamos testes sintéticos sequenciais e aleatórios com as seguintes configurações:

Sequencial: 2x 1 GiB (Blocos 1 MiB) 8 Queues 1 Thread

Aleatórios: 2x 1 GiB (Blocos 4 KiB) 1 Queue 1/2/4/8/16 Threads

Começando nos testes sequenciais, na leitura houve uma queda bem pequena no desempenho, mas na escrita, agora, ele atinge apenas as velocidades nativa da NAND quando o SLC Cache está desativado.

Curiosamente, sua latência na escrita quase não mudou, embora houve uma diferença em relação ao SLC Cache ativado.

Em cenários aleatórios como este, o pSLC Cache realmente ajudava na leitura, já em sua escrita, como ele atua ainda na capacidade nativa das NANDs, não houve uma diferença de desempenho, pois o SSD consegue entregar com facilidade mais de 1GB/s de escrita.

Uma peculiaridade interessante é que com pSLC Cache desativado, a leitura caiu, mas a escrita teve um desempenho maior em algumas rodadas, mas em outras, foi bem inferior, na média, ele acabou ficando acima.

3DMark – Storage Benchmark

Neste benchmark, são realizados diversos testes voltados a armazenamento, incluindo testes de carregamento de games como Call of Duty Black Ops 4, Overwatch, gravação e streaming com o O.B.S. de uma gameplay à 1080p 60 FPS, instalação de alguns jogos e transferências de arquivos de pastas de games.

image027

Nesse benchmark com foco maior em ambientes casuais, com o Cache desativado, o desempenho foi muito semelhante por ser uma carga de trabalho menos intensiva, em cenários mais realísticos.

PCMARK 10 – FULL SYSTEM DRIVE BENCHMARK

Neste teste, foi utilizada a ferramenta Storage Test e o teste “Full System Drive Benchmark”, que faz testes leves e pesados no SSD.

pcmark10 fb og

Dentre estes traces podemos observar testes como:
– Boot Windows 10
– Adobe After Effects: Iniciar a aplicação até estar pronto para uso
– Adobe Illustrator: Iniciar a aplicação até estar pronto para uso
– Adobe Premiere Pro: Iniciar a aplicação até estar pronto para uso
– Adobe Lightroom: Iniciar a aplicação até estar pronto para uso
– Adobe Photoshop: Iniciar a aplicação até estar pronto para uso
– Battlefield V: Tempo de carregamento até o menu iniciar
– Call of Duty Black Ops 4: Tempo de carregamento até o menu iniciar
– Overwatch: Tempo de carregamento até o menu iniciar
– Usando Adobe After Effects
– Usando Microsoft Excel
– Usado Adobe Illustrator
– Usando Adobe InDesign
– Usando Microsoft PowerPoint
– Usando Adobe Photoshop (Uso intenso)
– Usando Adobe Photoshop (Uso mais leve)
– Copiando 4 arquivos ISOs, 20GB ao total de um disco secundário (Teste de Escrita)
– Realizando a cópia do arquivo ISO (Teste de leitura-escrita)
– Copiando o arquivo ISO para um disco secundário (Leitura)
– Copiando 339 arquivos JPEG (Fotos) para o disco sendo testado (Escrita)
– Criando cópias destes arquivos JPEG (Leitura-Escrita)
– Copiando 339 arquivos JPEG (Fotos) para outro disco (Leitura)

image034

Neste cenário, que é um benchmark prático com foco um pouco maior em escrita do que o 3DMark, pois trata-se de um ambiente mais voltado a produtividade, é possível notar a diferença prática, embora pequena, quando desativamos o SLC Cache no SSD.

TESTE DE PROJETO – Adobe Premiere Pro 2021

A seguir, utilizamos o Adobe Premiere para medir o tempo médio de abertura de um projeto de cerca de 16.5GB com resolução 4K, 120Mbps de bitrate, cheio de efeitos até que estivesse pronto para edição. Ressaltando apenas que o SSD testado é sempre como drive secundário sem o sistema operacional instalado, pois isso poderia afetar o resultado, gerando inconsistências.

image037

Houve uma pequena diferença no carregamento do projeto, mas nada muito significativo, contudo, em projetos muito maiores, a diferença pode acabar sendo maior.

TESTE DE TEMPO DE CARREGAMENTO DE GAMES E BOOT DO WINDOWS

Fizemos uma comparação entre o SSD com pSLC Cache e em pSLC Mode, utilizando o benchmark do Final Fantasy XIV.

image038

O mesmo ocorre em carregamento de games, pois a limitação está na API do game e esta não é otimizada para sentirmos uma diferença grande.

image042

Assim como o Windows, que não consegue desfrutar de recursos como este que aplicamos no SSD.

TESTE DE CÓPIA DE ARQUIVOS

Neste teste, foi feita a cópia dos arquivos ISOs e do CSGO de uma RAM Disk para o SSD para ver como ele se sai. Foram utilizadas a ISO do Windows 10 21H1 de 6.25GB (1 arquivo) juntos da Pasta de instalação do CSGO de 25.2GB. 

image051

Aqui a diferença foi gritante, pois mesmo que sejam transferências rápidas do cotidiano, o tempo foi literalmente mais que o dobro de quando o pSLC Cache estava ativado. Em arquivos muito maiores, essa diferença tende a piorar.

image053

E como haviamos dito…. a situação realmente piorou, o que prova que em cenários como este o pSLC Cache realmente faz toda diferença.

TESTE DE TEMPERATURA

Neste trecho da análise, observaremos a temperatura do SSD durante um teste de stress, onde o SSD recebe arquivos de forma contínua para podermos saber se houve algum thermal throtling com seus componentes internos que pudessem gerar algum gargalo ou perda de performance.

image055

No que se refere a temperatura, não houve diferença, o SSD esquentou da mesma maneira, o que mudou foi o tempo que levou para atingir a temperatura máxima, pois com o pSLC Cache ativado, essa temperatura máxima é atingida bem mais rapidamente devido sua largura de banda mais elevada.

CONSUMO ELÉTRICO E EFICIÊNCIA

SSDs da mesma forma que diversos outros componentes do nosso sistema tem um determinado consumo elétrico. Os mais eficientes conseguem realizar tarefas que foram requisitadas de forma rápida e com um consumo relativamente baixo, para que assim consiga transitar novamente para seus power states em idle aonde tende a ter um consumo menor.

quarch programmable power module
Agradecimento especial a Quarch Solutions por terem enviado esta unidade para testes

Neste trecho da análise utilizaremos o Quarch Programmable Power Module que a Quarch Solutions nos enviou (foto acima) para realizar estes testes e verificar o quão eficiente o SSD é. Nesta metodologia serão realizados 3 testes: O consumo máximo que o SSD possui, uma média em cenários práticos e casuais e em idle.

Este conjunto de teste, especialmente o de eficiência e em idle são importantes principalmente para usuários que pretendem utilizar drives em laptops, pois SSDs ficam a esmagadora maioria do tempo em power states de baixo consumo (Idle), portanto, isso ajuda e muito a economizar bateria.

image063

Em sua eficiência, houve uma queda enorme, mesmo que o consumo elétrico tenha diminuido. Isso ocorre pois embora a largura de banda tenha caído, o consumo também caiu. Quando o SLC Cache estava ativo o consumo do SSD estava próximo dos 5W, porém, o SSD pegava mais de 3000 MB/s em largura de banda.

Mas quando o pSLC Cache havia sido desabilitado, podemos ver que sua largura de banda ficou um pouco acima dos 1900 MB/s, ou seja, quase metade e não houve diferença em seu consumo elétrico, o que destruiu a eficiência do SSD.

image057

No seu consumo máximo, houve sim uma diferença grand e isso ocorreu pois o cenário que o SSD teve o maior consumo foi na região de SLC Cache, onde ele ultrapassou os 7.3W de consumo, agora que ele fica no estado TLC constante, ele não atinge essa largura de banda, o que diminuiu o consumo elétrico.

image059

Ao tirarmos a média durante a transferência de arquivos, observamos que não houve diferença neste cenário.

image061

O mesmo pode ser dito em Idle, aonde esta pequena diferença pode ser apenas varição de rodada.

O que podemos levar em conclusão com isso?

O pSLC Cache tem inumeras vantagens no desempenho em diversos cenários, mas em alguns, a diferença é tão pequena, que se ela torna-se imperceptível.

Mas em alguns aspectos ele acaba ajudando também no quesito de eficiência do SSD, além de contribuir também em sua durabilidade, portanto, o pSLC Cache acaba contribuindo bastante para a qualidade de um produto como este.

Você também pode gostar...

9 Responses

  1. manotroll disse:

    se rodar de modo puro como não perde quase nada de fato dura mais ou menos ?

  2. Israel Fernandes disse:

    Onde posso conseguir essa ferramenta para fazer reparo em uns Netac NV7000 que tenho aqui.

Deixe uma resposta