<div dir="ltr">I tried re-running the version that came with Ubuntu 12.04 LTS and it very consistently segfaults at that point... so I went and pulled a copy of the most recent source from Git and I'm trying xfs_repair 3.2.0 now. I'll see how that goes (it'll probably take a day or two to run; 450 TB volume) and report back. Thanks everyone for the suggestions and feedback so far.<div>
<br></div><div>Best,</div><div><br></div><div>Sean</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Sun, Jun 1, 2014 at 6:48 PM, Dave Chinner <span dir="ltr"><<a href="mailto:david@fromorbit.com" target="_blank">david@fromorbit.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="">On Sun, Jun 01, 2014 at 12:21:55PM -0400, Sean Caron wrote:<br>
> Sorry, all, I was a little out-of-it on Friday afternoon, of course I had<br>
> kicked off xfs_repair actually in the background with all output sent to a<br>
> file, and I was just doing 'tail -f' on that file.<br>
><br>
> So I kill the 'tail -f' and jump back to the command line, it appears that<br>
> xfs_repair segfaulted and died.<br>
><br>
> That line of text:<br>
><br>
> disconnected inode 1109099673,<br>
><br>
> was indeed the last thing that it printed before it crashed.<br>
><br>
> If I look in dmesg, I just see -<br>
><br>
> xfs_repair[6770]: segfault at 28 ip 000000000042307b sp 00007fffef61bad0<br>
> error 4 in xfs_repair[400000+72000]<br>
><br>
> and that's it.<br>
><br>
> I checked with 'df' and there's plenty of space everywhere; I don't see why<br>
> it would have faulted out trying to connect something to lost+found.<br>
><br>
> Underlying storage should be good; this is basically a RAID 60 built on top<br>
> of a bunch of JBODs with LSI SAS9200 cards. MD sees all strings as started<br>
> and running OK; no problems getting the array assembled at all.<br>
><br>
> Since Dave is saying it's OK to try re-running xfs_repair; it'll just pick<br>
> up where it left off; let me give it another pass and see if it manages to<br>
> complete, or if it segfaults out again. I guess it it poops out a second<br>
> time, maybe we'll just want to consider rebuilding the filesystem and<br>
> restoring from our copies?<br>
<br>
</div>You should update to the latest version of xfs_repair first (3.2.0).<br>
If that still crashes, running xfs-repair under gdb to get a stack<br>
trace would be a good start, or sending me a metadump image so I can<br>
reproduce the crash myself would be even better...<br>
<div class="HOEnZb"><div class="h5"><br>
Cheers,<br>
<br>
Dave.<br>
--<br>
Dave Chinner<br>
<a href="mailto:david@fromorbit.com">david@fromorbit.com</a><br>
</div></div></blockquote></div><br></div>