mirror of
https://github.com/ipfs/kubo.git
synced 2025-06-29 01:12:24 +08:00
Merge pull request #1680 from ipfs/feat/tar-fmt
first pass at a tar importer
This commit is contained in:
@ -108,6 +108,7 @@ var rootSubcommands = map[string]*cmds.Command{
|
|||||||
"resolve": ResolveCmd,
|
"resolve": ResolveCmd,
|
||||||
"stats": StatsCmd,
|
"stats": StatsCmd,
|
||||||
"swarm": SwarmCmd,
|
"swarm": SwarmCmd,
|
||||||
|
"tar": TarCmd,
|
||||||
"tour": tourCmd,
|
"tour": tourCmd,
|
||||||
"file": unixfs.UnixFSCmd,
|
"file": unixfs.UnixFSCmd,
|
||||||
"update": UpdateCmd,
|
"update": UpdateCmd,
|
||||||
|
113
core/commands/tar.go
Normal file
113
core/commands/tar.go
Normal file
@ -0,0 +1,113 @@
|
|||||||
|
package commands
|
||||||
|
|
||||||
|
import (
|
||||||
|
"io"
|
||||||
|
"strings"
|
||||||
|
|
||||||
|
cmds "github.com/ipfs/go-ipfs/commands"
|
||||||
|
core "github.com/ipfs/go-ipfs/core"
|
||||||
|
path "github.com/ipfs/go-ipfs/path"
|
||||||
|
tar "github.com/ipfs/go-ipfs/tar"
|
||||||
|
)
|
||||||
|
|
||||||
|
var TarCmd = &cmds.Command{
|
||||||
|
Helptext: cmds.HelpText{
|
||||||
|
Tagline: "utility functions for tar files in ipfs",
|
||||||
|
},
|
||||||
|
|
||||||
|
Subcommands: map[string]*cmds.Command{
|
||||||
|
"add": tarAddCmd,
|
||||||
|
"cat": tarCatCmd,
|
||||||
|
},
|
||||||
|
}
|
||||||
|
|
||||||
|
var tarAddCmd = &cmds.Command{
|
||||||
|
Helptext: cmds.HelpText{
|
||||||
|
Tagline: "import a tar file into ipfs",
|
||||||
|
ShortDescription: `
|
||||||
|
'ipfs tar add' will parse a tar file and create a merkledag structure to represent it.
|
||||||
|
`,
|
||||||
|
},
|
||||||
|
|
||||||
|
Arguments: []cmds.Argument{
|
||||||
|
cmds.FileArg("file", true, false, "tar file to add").EnableStdin(),
|
||||||
|
},
|
||||||
|
Run: func(req cmds.Request, res cmds.Response) {
|
||||||
|
nd, err := req.InvocContext().GetNode()
|
||||||
|
if err != nil {
|
||||||
|
res.SetError(err, cmds.ErrNormal)
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
fi, err := req.Files().NextFile()
|
||||||
|
if err != nil {
|
||||||
|
res.SetError(err, cmds.ErrNormal)
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
node, err := tar.ImportTar(fi, nd.DAG)
|
||||||
|
if err != nil {
|
||||||
|
res.SetError(err, cmds.ErrNormal)
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
k, err := node.Key()
|
||||||
|
if err != nil {
|
||||||
|
res.SetError(err, cmds.ErrNormal)
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
fi.FileName()
|
||||||
|
res.SetOutput(&AddedObject{
|
||||||
|
Name: fi.FileName(),
|
||||||
|
Hash: k.B58String(),
|
||||||
|
})
|
||||||
|
},
|
||||||
|
Type: AddedObject{},
|
||||||
|
Marshalers: cmds.MarshalerMap{
|
||||||
|
cmds.Text: func(res cmds.Response) (io.Reader, error) {
|
||||||
|
o := res.Output().(*AddedObject)
|
||||||
|
return strings.NewReader(o.Hash), nil
|
||||||
|
},
|
||||||
|
},
|
||||||
|
}
|
||||||
|
|
||||||
|
var tarCatCmd = &cmds.Command{
|
||||||
|
Helptext: cmds.HelpText{
|
||||||
|
Tagline: "export a tar file from ipfs",
|
||||||
|
ShortDescription: `
|
||||||
|
'ipfs tar cat' will export a tar file from a previously imported one in ipfs
|
||||||
|
`,
|
||||||
|
},
|
||||||
|
|
||||||
|
Arguments: []cmds.Argument{
|
||||||
|
cmds.StringArg("path", true, false, "ipfs path of archive to export").EnableStdin(),
|
||||||
|
},
|
||||||
|
Run: func(req cmds.Request, res cmds.Response) {
|
||||||
|
nd, err := req.InvocContext().GetNode()
|
||||||
|
if err != nil {
|
||||||
|
res.SetError(err, cmds.ErrNormal)
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
p, err := path.ParsePath(req.Arguments()[0])
|
||||||
|
if err != nil {
|
||||||
|
res.SetError(err, cmds.ErrNormal)
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
root, err := core.Resolve(req.Context(), nd, p)
|
||||||
|
if err != nil {
|
||||||
|
res.SetError(err, cmds.ErrNormal)
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
r, err := tar.ExportTar(req.Context(), root, nd.DAG)
|
||||||
|
if err != nil {
|
||||||
|
res.SetError(err, cmds.ErrNormal)
|
||||||
|
return
|
||||||
|
}
|
||||||
|
|
||||||
|
res.SetOutput(r)
|
||||||
|
},
|
||||||
|
}
|
228
tar/format.go
Normal file
228
tar/format.go
Normal file
@ -0,0 +1,228 @@
|
|||||||
|
package tarfmt
|
||||||
|
|
||||||
|
import (
|
||||||
|
"archive/tar"
|
||||||
|
"bytes"
|
||||||
|
"errors"
|
||||||
|
"io"
|
||||||
|
"io/ioutil"
|
||||||
|
"strings"
|
||||||
|
|
||||||
|
importer "github.com/ipfs/go-ipfs/importer"
|
||||||
|
chunk "github.com/ipfs/go-ipfs/importer/chunk"
|
||||||
|
dag "github.com/ipfs/go-ipfs/merkledag"
|
||||||
|
dagutil "github.com/ipfs/go-ipfs/merkledag/utils"
|
||||||
|
uio "github.com/ipfs/go-ipfs/unixfs/io"
|
||||||
|
u "github.com/ipfs/go-ipfs/util"
|
||||||
|
|
||||||
|
context "github.com/ipfs/go-ipfs/Godeps/_workspace/src/golang.org/x/net/context"
|
||||||
|
)
|
||||||
|
|
||||||
|
var log = u.Logger("tarfmt")
|
||||||
|
|
||||||
|
var blockSize = 512
|
||||||
|
var zeroBlock = make([]byte, blockSize)
|
||||||
|
|
||||||
|
func marshalHeader(h *tar.Header) ([]byte, error) {
|
||||||
|
buf := new(bytes.Buffer)
|
||||||
|
w := tar.NewWriter(buf)
|
||||||
|
err := w.WriteHeader(h)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
return buf.Bytes(), nil
|
||||||
|
}
|
||||||
|
|
||||||
|
func ImportTar(r io.Reader, ds dag.DAGService) (*dag.Node, error) {
|
||||||
|
rall, err := ioutil.ReadAll(r)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
|
||||||
|
r = bytes.NewReader(rall)
|
||||||
|
|
||||||
|
tr := tar.NewReader(r)
|
||||||
|
|
||||||
|
root := new(dag.Node)
|
||||||
|
root.Data = []byte("ipfs/tar")
|
||||||
|
|
||||||
|
e := dagutil.NewDagEditor(ds, root)
|
||||||
|
|
||||||
|
for {
|
||||||
|
h, err := tr.Next()
|
||||||
|
if err != nil {
|
||||||
|
if err == io.EOF {
|
||||||
|
break
|
||||||
|
}
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
|
||||||
|
header := new(dag.Node)
|
||||||
|
|
||||||
|
headerBytes, err := marshalHeader(h)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
|
||||||
|
header.Data = headerBytes
|
||||||
|
|
||||||
|
if h.Size > 0 {
|
||||||
|
spl := chunk.NewRabin(tr, uint64(chunk.DefaultBlockSize))
|
||||||
|
nd, err := importer.BuildDagFromReader(ds, spl, nil)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
|
||||||
|
err = header.AddNodeLinkClean("data", nd)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
_, err = ds.Add(header)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
|
||||||
|
path := escapePath(h.Name)
|
||||||
|
err = e.InsertNodeAtPath(context.Background(), path, header, func() *dag.Node { return new(dag.Node) })
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
root = e.GetNode()
|
||||||
|
_, err = ds.Add(root)
|
||||||
|
if err != nil {
|
||||||
|
return nil, err
|
||||||
|
}
|
||||||
|
|
||||||
|
return root, nil
|
||||||
|
}
|
||||||
|
|
||||||
|
// adds a '-' to the beginning of each path element so we can use 'data' as a
|
||||||
|
// special link in the structure without having to worry about
|
||||||
|
func escapePath(path string) string {
|
||||||
|
elems := strings.Split(strings.Trim(path, "/"), "/")
|
||||||
|
for i, e := range elems {
|
||||||
|
elems[i] = "-" + e
|
||||||
|
}
|
||||||
|
return strings.Join(elems, "/")
|
||||||
|
}
|
||||||
|
|
||||||
|
type tarReader struct {
|
||||||
|
links []*dag.Link
|
||||||
|
ds dag.DAGService
|
||||||
|
|
||||||
|
childRead *tarReader
|
||||||
|
hdrBuf *bytes.Reader
|
||||||
|
fileRead *countReader
|
||||||
|
pad int
|
||||||
|
|
||||||
|
ctx context.Context
|
||||||
|
}
|
||||||
|
|
||||||
|
func (tr *tarReader) Read(b []byte) (int, error) {
|
||||||
|
// if we have a header to be read, it takes priority
|
||||||
|
if tr.hdrBuf != nil {
|
||||||
|
n, err := tr.hdrBuf.Read(b)
|
||||||
|
if err == io.EOF {
|
||||||
|
tr.hdrBuf = nil
|
||||||
|
return n, nil
|
||||||
|
}
|
||||||
|
return n, err
|
||||||
|
}
|
||||||
|
|
||||||
|
// no header remaining, check for recursive
|
||||||
|
if tr.childRead != nil {
|
||||||
|
n, err := tr.childRead.Read(b)
|
||||||
|
if err == io.EOF {
|
||||||
|
tr.childRead = nil
|
||||||
|
return n, nil
|
||||||
|
}
|
||||||
|
return n, err
|
||||||
|
}
|
||||||
|
|
||||||
|
// check for filedata to be read
|
||||||
|
if tr.fileRead != nil {
|
||||||
|
n, err := tr.fileRead.Read(b)
|
||||||
|
if err == io.EOF {
|
||||||
|
nr := tr.fileRead.n
|
||||||
|
tr.pad = (blockSize - (nr % blockSize)) % blockSize
|
||||||
|
tr.fileRead.Close()
|
||||||
|
tr.fileRead = nil
|
||||||
|
return n, nil
|
||||||
|
}
|
||||||
|
return n, err
|
||||||
|
}
|
||||||
|
|
||||||
|
// filedata reads must be padded out to 512 byte offsets
|
||||||
|
if tr.pad > 0 {
|
||||||
|
n := copy(b, zeroBlock[:tr.pad])
|
||||||
|
tr.pad -= n
|
||||||
|
return n, nil
|
||||||
|
}
|
||||||
|
|
||||||
|
if len(tr.links) == 0 {
|
||||||
|
return 0, io.EOF
|
||||||
|
}
|
||||||
|
|
||||||
|
next := tr.links[0]
|
||||||
|
tr.links = tr.links[1:]
|
||||||
|
|
||||||
|
headerNd, err := next.GetNode(tr.ctx, tr.ds)
|
||||||
|
if err != nil {
|
||||||
|
return 0, err
|
||||||
|
}
|
||||||
|
|
||||||
|
tr.hdrBuf = bytes.NewReader(headerNd.Data)
|
||||||
|
|
||||||
|
dataNd, err := headerNd.GetLinkedNode(tr.ctx, tr.ds, "data")
|
||||||
|
if err != nil && err != dag.ErrNotFound {
|
||||||
|
return 0, err
|
||||||
|
}
|
||||||
|
|
||||||
|
if err == nil {
|
||||||
|
dr, err := uio.NewDagReader(tr.ctx, dataNd, tr.ds)
|
||||||
|
if err != nil {
|
||||||
|
log.Error("dagreader error: ", err)
|
||||||
|
return 0, err
|
||||||
|
}
|
||||||
|
|
||||||
|
tr.fileRead = &countReader{r: dr}
|
||||||
|
} else if len(headerNd.Links) > 0 {
|
||||||
|
tr.childRead = &tarReader{
|
||||||
|
links: headerNd.Links,
|
||||||
|
ds: tr.ds,
|
||||||
|
ctx: tr.ctx,
|
||||||
|
}
|
||||||
|
}
|
||||||
|
|
||||||
|
return tr.Read(b)
|
||||||
|
}
|
||||||
|
|
||||||
|
func ExportTar(ctx context.Context, root *dag.Node, ds dag.DAGService) (io.Reader, error) {
|
||||||
|
if string(root.Data) != "ipfs/tar" {
|
||||||
|
return nil, errors.New("not an ipfs tarchive")
|
||||||
|
}
|
||||||
|
return &tarReader{
|
||||||
|
links: root.Links,
|
||||||
|
ds: ds,
|
||||||
|
ctx: ctx,
|
||||||
|
}, nil
|
||||||
|
}
|
||||||
|
|
||||||
|
type countReader struct {
|
||||||
|
r io.ReadCloser
|
||||||
|
n int
|
||||||
|
}
|
||||||
|
|
||||||
|
func (r *countReader) Read(b []byte) (int, error) {
|
||||||
|
n, err := r.r.Read(b)
|
||||||
|
r.n += n
|
||||||
|
return n, err
|
||||||
|
}
|
||||||
|
|
||||||
|
func (r *countReader) Close() error {
|
||||||
|
return r.r.Close()
|
||||||
|
}
|
49
test/sharness/t0210-tar.sh
Executable file
49
test/sharness/t0210-tar.sh
Executable file
@ -0,0 +1,49 @@
|
|||||||
|
#!/bin/sh
|
||||||
|
#
|
||||||
|
# Copyright (c) 2015 Jeromy Johnson
|
||||||
|
# MIT Licensed; see the LICENSE file in this repository.
|
||||||
|
#
|
||||||
|
|
||||||
|
test_description="Test tar commands"
|
||||||
|
|
||||||
|
. lib/test-lib.sh
|
||||||
|
|
||||||
|
test_init_ipfs
|
||||||
|
|
||||||
|
test_expect_success "create some random files" '
|
||||||
|
mkdir foo &&
|
||||||
|
random 10000 > foo/a &&
|
||||||
|
random 12345 > foo/b &&
|
||||||
|
mkdir foo/bar &&
|
||||||
|
random 5432 > foo/bar/baz &&
|
||||||
|
ln -s ../a foo/bar/link &&
|
||||||
|
echo "exit" > foo/script &&
|
||||||
|
chmod +x foo/script
|
||||||
|
'
|
||||||
|
|
||||||
|
test_expect_success "tar those random files up" '
|
||||||
|
tar cf files.tar foo/
|
||||||
|
'
|
||||||
|
|
||||||
|
test_expect_success "'ipfs tar add' succeeds" '
|
||||||
|
TAR_HASH=$(ipfs tar add files.tar)
|
||||||
|
'
|
||||||
|
|
||||||
|
test_expect_success "'ipfs tar cat' succeeds" '
|
||||||
|
mkdir output &&
|
||||||
|
ipfs tar cat $TAR_HASH > output/out.tar
|
||||||
|
'
|
||||||
|
|
||||||
|
test_expect_success "can extract tar" '
|
||||||
|
tar xf output/out.tar -C output/
|
||||||
|
'
|
||||||
|
|
||||||
|
test_expect_success "files look right" '
|
||||||
|
diff foo/a output/foo/a &&
|
||||||
|
diff foo/b output/foo/b &&
|
||||||
|
diff foo/bar/baz output/foo/bar/baz &&
|
||||||
|
[ -L output/foo/bar/link ] &&
|
||||||
|
[ -x foo/script ]
|
||||||
|
'
|
||||||
|
|
||||||
|
test_done
|
Reference in New Issue
Block a user