Como encontrar tipos de arquivos compactados no Ubuntu Linux



Experimente Nosso Instrumento Para Eliminar Problemas

Às vezes, ao tentar extrair um .tar.gz, .tar.xz, .tar.bz2 ou mesmo um arquivo zip normal, você descobrirá que obtém um erro como xz: (stdin): Formato de arquivo não reconhecido que indica que o sistema operacional não consegue extraí-lo. Ubuntu, e outras distribuições derivadas de Debian do Linux, fornecem um utilitário de arquivo que permitirá que você saiba se o que você está tentando extrair está nomeado corretamente. Ocasionalmente, é possível que um arquivo compactado tenha sido nomeado incorretamente ou, às vezes, devido a um erro de um navegador da Web, algo que não é um arquivo compactado pode ser nomeado como tal. Embora o Linux e muitos outros sistemas operacionais baseados em Unix não dependam completamente das extensões de arquivo da mesma forma que o DOS e o Windows, eles ainda as usam para identificar arquivos compactados.



Se o utilitário de arquivo informar que o arquivo é do tipo errado, você simplesmente precisará alterar o nome para a extensão correta e tentar extraí-lo novamente. Se não for um arquivo, o utilitário de arquivo ainda funcionará para identificar o tipo correto. É mais do que provável que você descubra que o arquivo é um arquivo HTML identificado por engano como arquivo, mas deve-se sempre ter cuidado ao extrair arquivos baixados da Internet. Os criminosos digitais às vezes modificam os arquivos para que apareçam como arquivos a fim de causar problemas aos usuários, portanto, o conselho do utilitário de arquivo deve ser levado a sério.



Identificando tipos de arquivo independentemente das extensões

Naturalmente, é sempre altamente recomendável que você execute uma verificação de malware em arquivos antes de extraí-los, mas presumindo que nada aconteceu, você pode ver vários tipos de mensagens de erro. Além das mensagens de xz ou gunzip, você também pode ver várias mensagens de erro do programa tar. Se você estiver recebendo erros que indicam tar: O filho retornou o status 1 ou tar: O erro não é recuperável: saindo agora, você pode estar extraindo algo que não deveria ser extraído ou pelo menos não da maneira que ordenou ao tar faça isso. Você pode ter tentado o unxz ou outros programas, que continuam a apresentar os mesmos erros ao longo do tempo.



No prompt CLI com o qual você está trabalhando, tente o arquivo theFileName.tar.xz, substituindo theFileName.tar.xz pelo nome do arquivo com o qual você está realmente trabalhando. A extensão pode ser atualmente .tar.gz, .tar.bz2, .txz, .tgz ou várias outras permutações. O comando file calcula a soma dos primeiros bytes do arquivo, que às vezes é chamado de número mágico. Esse chamado teste de mágica é então julgado em relação a uma tabela, que por sua vez é mapeada para muitos tipos diferentes de arquivos. Se o arquivo descobrir que é realmente um arquivo de texto de algum tipo, ele relatará em qual codificação o texto está.

Por exemplo, você pode file.tar.xz: documento HTML, texto Unicode UTF-8, com linhas muito longas, o que indica que seu navegador realmente baixou uma página da Web em vez de um arquivo. Um comando wget com defeito também pode tornar isso uma realidade. Não há como qualquer extração extrair arquivos de um arquivo como esse. Se ele afirma que é de fato um arquivo compactado .xz formatado corretamente, você pode tentar o apt list xz-utils para se certificar de que os pacotes xz estão instalados, embora o Ubuntu e o Debian geralmente exijam sua instalação para fins de gerenciamento de pacotes . O mesmo vale para todos os vários derivados do Ubuntu, como Lubuntu e Kubuntu.

O utilitário de arquivo às vezes simplesmente retorna dados sem nenhuma outra informação. Embora isso possa ser preciso para alguns arquivos criados por jogos online ou editores binários, não é algo que você deva ver em um arquivo e pode indicar corrupção de arquivo. O tipo de dados também pode corresponder teoricamente a alguns dos formatos proprietários que o Classic Macintosh e posterior OS X usavam, que normalmente não deveriam ser extraídos no Linux. Se o arquivo informar que um arquivo compactado é na verdade um executável do Windows ou MS-DOS, pode muito bem ser um malware projetado para atacar PCs com Windows.



Você pode ver algo como theFileName.zip: dados de archive ZIP, pelo menos V2.0 para extrair como um tipo de retorno. Você pode renomear o arquivo de .tar.xz para .zip para extraí-lo adequadamente nesse caso. Você também pode renomeá-lo .tar.bz2 ou .tar.gz, dependendo da saída fornecida pelo utilitário de arquivo. Depois de fazer isso, você pode extraí-los normalmente, mesmo que não fosse possível antes. Se você tiver um arquivo ZIP ou algo semelhante, poderá usar o arquivo -z theFileName.zip para ver não apenas uma lista do que está no arquivo, mas também o que o utilitário de arquivo pensa que cada tipo é.

Retornar um valor do executável Intel 80386 PE32 ao executar o utilitário de arquivo em um arquivo com a opção -z pode indicar que há um programa Windows legítimo dentro dele. Se for esse o caso, e você se certificou de executar várias varreduras de malware nele, pode ser capaz de executá-lo com a camada de compatibilidade do Wine após extraí-lo. Algumas das linhas que o arquivo retorna podem ser teoricamente muito longas, então você pode querer pressionar F11 dentro da janela do terminal. Isso o torna grande o suficiente para cobrir toda a área de trabalho, sem ter que recorrer a um console virtual Linux.

Você também pode tentar usar a opção –apple, que fornece os identificadores de arquivo Apple antigos que você pode precisar se tentar compartilhar arquivos com usuários de outros sistemas operacionais.

Lembre-se de que o arquivo identificará alguns tipos de arquivos como texto ASCII ou Unicode, mesmo quando um usuário possa pensar que eles não seriam classificados como tal. Um arquivo .csv é um arquivo de planilha especial mapeado para determinados caracteres de texto. O comando file irá chamar um .csv feito em uma máquina Windows ASCII com terminadores CRLF, e se você fizer um em sua própria máquina Ubuntu, pode chamá-lo de texto Unicode. Este não é um erro que indica que uma extensão de arquivo está errada, mas apenas uma peculiaridade da forma como ela classifica os arquivos.

4 minutos lidos